摘要:
加-d参数代表只导表结构,不加此参数则代表导出结构以及表数据,> 代表录入某一文件,若为>>则表示将内容追加到某文件末尾。 -- 导出数据库为dbname的表结构 mysqldump -uuser -pdbpasswd -d dbname >db.sql; -- 导出数据库为dbname某张表结构 阅读全文
摘要:
简介 PyMySQL是在 Python3.x 版本中用于连接 MySQL 服务器的一个库,Python2中是使用mysqldb。 安装 pip3 install pymysql 创建连接 #!/usr/bin/python3 import pymysql # 打开数据库连接 db = pymysql 阅读全文
摘要:
本篇主要是通过对豆瓣图书《平凡的世界》短评进行抓取并进行分析,并用snowNLP对其进行情感分析。 用到的模块有snowNLP,是一个python库,用来进行情感分析。 1.抓取数据 我们把抓取到的数据存储到sqlite,先建表,结构如下: CREATE TABLE comment( id inte 阅读全文
摘要:
上次介绍了beautifulsoup的使用,那就来进行运用下吧。本篇将主要介绍通过爬取豆瓣图书的信息,存储到sqlite数据库进行分析。 1.sqlite SQLite是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。它是一个零配置的数据库,这意味着与其他数据库 阅读全文
摘要:
1.了解 pyquery库是jQuery的Python实现,能够以jQuery的语法来操作解析 HTML 文档,易用性和解析速度都很好。 2.安装 pip install pyquery 3引用 from pyquery import PyQuery as pq 4.初始化 1)字符串 html = 阅读全文
摘要:
在.vimrc中添加以下代码后,重启vim即可实现按TAB产生4个空格:set ts=4 (注:ts是tabstop的缩写,设TAB宽4个空格)set expandtab 对于已保存的文件,可以使用下面的方法进行空格和TAB的替换:TAB替换为空格::set ts=4:set expandtab:% 阅读全文
摘要:
好久没更新博客了。打算写一个python的爬虫系列及数据分析。falg也不能随便立,以免打脸。 python爬取内容,是过程,分析数据是结果,最终得出结论才是目的。python爬虫爬取了内容,一般都是从网页上获取,那我们从html页面中如何提取出自己想要的信息呢?那就需要解析。目前常用的有Beaut 阅读全文
摘要:
diff命令可以生成两个文件之间的差异对比。 (1) 先创建下列用于演示的文件。文件 1:version1.txt 文件 2:version2.txt (2) 非一体化(nonunified)形式的diff输出(不使用-u选项)如下:$ diff version1.txt version2.txt3 阅读全文
摘要:
1.预备知识 comm命令可用于比较两个已排序的文件。它可以显示出第一个文件和第二个文件所独有的行以及这两个文件所共有的行。该命令有一些选项可以禁止显示指定的列,以便于执行交集和求差操作。 交集(intersection):打印出两个文件所共有的行。 求差(difference):打印出指定文件中所 阅读全文
摘要:
Linux tr 命令用于转换或删除文件中的字符。 tr 指令从标准输入设备读取数据,经过字符串转译后,将结果输出到标准输出设备。 在tr中利用集合的概念,可以轻松地将字符从一个集合映射到另一个集合中。 语法 参数说明: -c, --complement:反选设定字符。也就是符合 SET1 的部份不 阅读全文