未分类
RTX3090+Ubuntu 18.04+tensorflow 2.3.0/2.4.0安装指南
近期实验室新购买一台服务器,配备了全新的3块RTX3090显卡。由于需要安装全新的显卡驱动以及CUDA,cuDNN才能正常使用。 使用 可以时时实时查看所有显卡的使用情况,并且可以查看驱动版本以及需要的CUDA版本,如下所示:驱动版本是455.38,需要的CUDA为11.1版本…
未分类
近期实验室新购买一台服务器,配备了全新的3块RTX3090显卡。由于需要安装全新的显卡驱动以及CUDA,cuDNN才能正常使用。 使用 可以时时实时查看所有显卡的使用情况,并且可以查看驱动版本以及需要的CUDA版本,如下所示:驱动版本是455.38,需要的CUDA为11.1版本…
算法
前言 关于tensorforce的背景可以从他的名字看出来,tensor*必然是师从tensorflow框架的,事实上也确实是由tensorflow框架来的。使用tensorforce可以快速的构建强化学习代码,同时还可以利用其中现有的强化学习框架,例如常见的AC,A2C,A3…
算法
列表推导式是常见的生成方式,同时[]*N也是快速生成多种元素的快捷方式。 例如以下两种生成方式: 生成的初始矩阵都是5*5的0矩阵: 但是真正对其中的元素进行赋值之后就会发现问题: 可以看出[]*N的方式生成的时候其实实现的是浅拷贝,而列表推导式则是完全开辟新的空间,因此对b的…
算法
在搭建自己的Model的时候,我们有时候需要自己从稍微低层的部分进行搭建,而不是直接用Sequential搭建模型,或者是使用Model(inputs,outputs)的方式搭建,例如下面这个简单的例子: 对 以及 的方法进行重载之后,就可以很简单的进行搭建模型,如下所示: 搭…
未分类
深度学习源码中经常出现的logits其实和统计中定义的$logit=log(\frac{p}{1-p})$没什么太大关系,就是定义的神经网络的一层输出结果。该输出一般会再接一个softmax layer输出normalize 后的概率,用于多分类。见下图:
未分类
最近由于需求,需要重载Keras的Model类,代码逻辑是好好的,但是最后运行的时候出现了NoImplementError这个错误,现实的是self.compute_output_shape没有在子类当中实现。代码如下: 查看keras以及别人的实现,发现很多都是继承的tf.k…
算法
Tensorflow的变量(Variable)或优化器(Optimizer)当中有一个use_locking的可选参数,一开始以为是字面意思:直接锁定不给更新参数,后来发现并不是,而是 在更新参数的时候使用锁,避免受多线程、多进程、以及在分布式模型中参数更新时受到影响 ,最典型…
算法
什么是MDN 对于一输入对一的输出的任务,传统的神经网络可以很好地进行预测/回归/分类。然而,对于一对多的问题,传统的网络无法胜任,此时MDN派上用场。 MDN的工作机制 与传统的NN不一样的是,MDN的预测输出是特定分布的参数值,例如指定三个正态分布进行叠加模拟,需要6个$\…
未分类
Transfer Learning对于没有大量计算资源,并且需要快速构造现有模型的人而言是极大的福音。我们可以将已经学到的模型参数(也可理解为模型学到的知识)通过某种方式来分享给新模型(对于结构或许有微调)从而加快并优化模型的学习效率不用像大多数网络那样从零开始学习。 而Fin…
Golang
最近开始学习Go,记录一下Go语言的学习笔记。 基础篇 1- 如果import了没有使用的包,那么会出现红线提醒"、import for side-effects"以及"unused import",我所使用的GoLand编辑器会在go build之后自动消除这些错误,这挺好的…
数据结构/图论
一点碎碎念 最近这几天,在搞华为的软件精英挑战赛,虽然比赛打的不咋地,但是好在能把以前的数据结构,图论相关知识复习一下(心态还是要摆正的)。不过话说回来,参加华为软件精英挑战赛,一定要熟悉C++,其他的Python,Java,C都是弟弟,不然时间上吃大亏。今年的初赛考察的是有向…
个人建站
最近增加了一个子域名,结果发现原来根域名下的文章点进去全部都显示404错误,后来上网查了一下,发现是什么Apache服务器的httpd.conf配置文件当中有些配置不对,改过之后还是没用,在此查证,发现是文章链接的问题,之前使用的是时间加标题的方式:2020/03/20/exa…