摘要: Finish crawl web learned from udacity 提示:在某些时候,你必须在page上调用get_page。这似乎违反直觉,但是我们用 page 这个词时,指的网页的网址 (url) 和文本内容 (html)。get_page所做的是,传入网页的网址 (url) 并返回文本 阅读全文
posted @ 2017-08-25 13:32 Neo007 阅读(336) 评论(0) 推荐(0)
摘要: 深度优先搜索算法的概念 与广度优先搜索算法不同,深度优先搜索算法类似与树的先序遍历。这种搜索算法所遵循的搜索策略是尽可能“深”地搜索一个图。它的基本思想如下:首先访问图中某一个起始顶点v,然后由v出发,访问与v相邻且未被访问的任一顶点w1,再访问与w1邻接且未被访问的任一顶点w2,….重复上述过程。 阅读全文
posted @ 2017-08-25 11:54 Neo007 阅读(2538) 评论(0) 推荐(0)
摘要: 进程、线程和协程之间的关系和区别也困扰我一阵子了,最近有一些心得,写一下。 进程拥有自己独立的堆和栈,既不共享堆,亦不共享栈,进程由操作系统调度。 线程拥有自己独立的栈和共享的堆,共享堆,不共享栈,线程亦由操作系统调度(标准线程是的)。 协程和线程一样共享堆,不共享栈,协程由程序员在协程的代码里显示 阅读全文
posted @ 2017-08-25 10:09 Neo007 阅读(210) 评论(0) 推荐(0)