摘要: 1.Hadoop分布式文件系统(HDFS) HDFS基于GFS(Google File System),能够存储海量的数据,并且使用分布式网络客户端透明访问。 HDFS中将文件拆分成特定大小的块结构(block structured filesystem),一个文件的不同块存储在不同的节点中。 为了 阅读全文
posted @ 2018-07-12 21:09 机器狗mo 阅读(450) 评论(0) 推荐(0)
摘要: ```python def get_ord_list(str): return [ord(i) for i in str] def calcu_approx(str1,str2): def dot(A,B): return (sum(a*b for a,b in zip(A,B))) def cosine_similarity(a,b): ... 阅读全文
posted @ 2018-06-26 11:45 机器狗mo 阅读(871) 评论(0) 推荐(0)
摘要: 背景 Screen是Linux非常好用的工具。由于经常在服务器上运行程序,本地不可能一直和服务器保持ssh连接,而且如果本地和服务器的连接断开,在服务器上运行的程序将会终止,如果使用screen来进行ssh连接,则可以在本地与远端服务器的连接断开后,继续保持服务器上的程序运行,在本地重新与远端服务器 阅读全文
posted @ 2018-06-11 23:10 机器狗mo 阅读(376) 评论(0) 推荐(0)
摘要: "LintCode 433. 岛屿的个数(Number of Islands)" 代码: 阅读全文
posted @ 2018-05-23 23:15 机器狗mo 阅读(188) 评论(0) 推荐(0)
摘要: ![](https://images2018.cnblogs.com/blog/724315/201804/724315-20180425134058962-428374661.jpg) 阅读全文
posted @ 2018-04-25 13:41 机器狗mo 阅读(285) 评论(0) 推荐(0)
摘要: ![](https://images2018.cnblogs.com/blog/724315/201804/724315-20180423130020216-1109232702.jpg) 阅读全文
posted @ 2018-04-23 13:01 机器狗mo 阅读(574) 评论(0) 推荐(0)
摘要: ``` # 对象赋值 a = 'hello world' b = a print('a:',a,', b:',b) # a: hello world , b: hello world print(id(a)==id(b)) # True a = 'Hello World' print('a:',a,', b:',b) # Hello World , b: hello world print(id(... 阅读全文
posted @ 2018-01-05 12:01 机器狗mo 阅读(156) 评论(0) 推荐(0)
摘要: 1. struct 和 class 区别,你更倾向用哪个 2. kNN,朴素贝叶斯,SVM 的优缺点,朴素贝叶斯的核心思想,有没有考虑属性之间不是相互独立的情况 3. 10 亿个整数,1G 内存,O(n) 算法,统计只出现一次的数。 4. SVM 非线性分类,核函数的作用 5. 海量数据排序 6. 阅读全文
posted @ 2017-10-31 14:01 机器狗mo 阅读(263) 评论(0) 推荐(0)
摘要: tensor的含义是张量,张量是什么,听起来很高深的样子,其实我们对于张量一点都不陌生,因为像标量,向量,矩阵这些都可以被认为是特殊的张量。如下图所示: 在TensorFlow中,tensor实际上就是各种“数”的统称。而flow是流动的意思。所以TensorFlow的意思就是“数”的流动,可以说T 阅读全文
posted @ 2017-10-21 20:41 机器狗mo 阅读(1034) 评论(0) 推荐(0)
摘要: https://pdfs.semanticscholar.org/d78b/6a5b0dcaa81b1faea5fb0000045a62513567.pdf 阅读全文
posted @ 2017-10-18 22:31 机器狗mo 阅读(546) 评论(0) 推荐(0)