2018年9月17日

强化学习(2)----Q-learning

摘要: 1、Q-learning主要是Q表: 当前状态s1,接下来可以有两个动作选择,看电视a1和学习a2,对于agent人来说,可以根据reward来作出决策(Policy)。目的就是得到奖励最大。 Q-learning的目的就是学习特定state下、特定Action的价值。 Q-learning的方法是 阅读全文

posted @ 2018-09-17 17:00 吱吱了了 阅读(709) 评论(0) 推荐(0)

Python数据分析前提-----pandas

摘要: pandas:知识脑图 https://bigquant.com/community/t/topic/129755 1、read_csv(url):读取数据 2、help(read_csv):打印函数相关用法 3、数据名.dtypes:读取数据的类型(int、float……) 4、type(数据名) 阅读全文

posted @ 2018-09-17 13:07 吱吱了了 阅读(424) 评论(0) 推荐(0)

算法36---字符串匹配算法

摘要: 一、题目:赎金信(一个字符串字母是不是都在另一个字符串中) 给定一个赎金信 (ransom) 字符串和一个杂志(magazine)字符串,判断第一个字符串ransom能不能由第二个字符串magazines里面的字符构成。如果可以构成,返回 true ;否则返回 false。 (题目说明:为了不暴露赎 阅读全文

posted @ 2018-09-17 09:54 吱吱了了 阅读(346) 评论(0) 推荐(0)

算法35---特殊等价字符串组

摘要: 1、题目: 你将得到一个字符串数组 A。 如果经过任意次数的移动,S == T,那么两个字符串 S 和 T 是特殊等价的。 一次移动包括选择两个索引 i 和 j,且 i%2 == j%2,并且交换 S[j] 和 S [i]。 现在规定,A 中的特殊等价字符串组是 A 的非空子集 S,这样不在 S 中 阅读全文

posted @ 2018-09-17 09:30 吱吱了了 阅读(631) 评论(0) 推荐(0)

导航