摘要:
策略梯度 value based的强化学习方法对价值函数进行了近似表示,policy based使用了类似的思路,策略$\pi$可以被描述为一个包含参数$\theta$的函数 $$ \pi_{\theta}(s, a)=P(a | s, \theta) \approx \pi(a | s) $$ 我 阅读全文
摘要:
微软的新终端Windows Terminal preview可以在Windows10应用商店或是 "github 上的Windows Terminal Preview的release页" 下载,顺便把图标 "terminal.ico" 也下载下来。图标可以新建个文件夹放到 新建注册表文件比如 ,内容 阅读全文
摘要:
今天在装linux的window双系统时,出现在无法使用linux引导的问题,开机总是自动进windows,照理来说我先装的window,后装的linux,应该是开机进grub引导才对。在主板的boot里根本没有linux项,后来用EasyUEFI检查发现linux的启动项被禁止和隐藏了!! 后来查 阅读全文
摘要:
windows10 的linux子系统(windows subsystem for linux)WSL 文件位置 以我的系统为例,WSL的root目录对应windows的: 其中AppData文件夹默认是隐藏的,但你可以在路径里输入AppData进去。但实际上微软为我们提供了一个默认的变量可以直接指 阅读全文
摘要:
title: cs231n assignment1 KNN tags: KNN cs231n categories: 机器学习 date: 2019年9月16日 17:03:13 利用KNN算法做图像分类。python2.7环境 首先运行 下的 获取数据集,如果你是windows用户,也可以在网盘下 阅读全文
摘要:
求1,20的最小公倍数,十分简单, py def gcd(x, y): if x 阅读全文
摘要:
标签(空格分隔): Euler 博客 Largest prime factor The prime factors of 13195 are 5, 7, 13 and 29. What is the largest prime factor of the number 600851475143 ? 阅读全文
摘要:
本文参考 "深入浅出 梯度下降法及其实现" ,对后面将公式转化为矩阵的形式加了些解释,便于大家理解。 梯度下降 是用来求函数最小值点的一种方法,所谓梯度在一元函数中是指某一点的斜率,在多元函数中可表示为一个向量,可由偏导求得,此向量的指向是函数值上升最快的方向。公式表示为: $$ \nabla J( 阅读全文
摘要:
使用过 ,重启后就失效,添加到 也不管用,后来通过在 里配置成功。 更改xorg里的键盘配置,增加 我用的archlinux在 ,有些可能在 /etc/X11/xorg.conf 一个可能的键盘字段类似下面这样 类似的命令可以在 里找到,比如 阅读全文
摘要:
title: "Python实现bp神经网络识别MNIST数据集" date: 2018 06 18T14:01:49+08:00 tags: [""] categories: ["python"] 前言 训练时读入的是.mat格式的训练集,测试正确率时用的是png格式的图片 代码 数据集下载: 链 阅读全文