随笔分类 - data
摘要:pip install python-Levenshtein
阅读全文
摘要:diff
阅读全文
摘要:from bs4 import BeautifulSoup import os filepath = 'D:\\pymine\\clean\\spider_map\\baidu_map_html_firstpage_pc_test\\' pathDir = os.listdir(filepath) name_poi_dic = {} need_todo_request = ['搜索结果'...
阅读全文
摘要:
阅读全文
摘要:spider from mobile to mobile to mobile ua
阅读全文
摘要:https://zh.wikipedia.org/zh-cn/ODBC ODBC(Open Database Connectivity,开放数据库互连)提供了一种标准的API(应用程序编程接口)方法来访问数据库管理系统(DBMS)。这些API利用SQL来完成其大部分任务。ODBC本身也提供了对SQL
阅读全文
摘要:w 缺少方法论 数据模型管理工具:不是DDL、excel、word 表有时间戳字段:便于今后ETL-抽取 逻辑建模使用CASE工具:如PowerDesign 逻辑模型应与之上(前)的概念模型一致 使用CASE工具由逻辑模型生成物理建模应用术语表自动生成物理模型的字段 数据建模师有效地和客户沟通,问出
阅读全文
摘要:py 3.6 python (2.7) py 3.6 py m pip install upgrade pip py m pip install numpy scipy matplotlib ipython jupyter pandas sympy nose py m pip install nlt
阅读全文
摘要:Bobby Luo 罗如意(18907295660@189.cn) 2011年7月 http://weibo.com/cquptvlry 电子商务中的BI应用初探 系统架构 对整个数据仓库的架构进行规划 数据库管理 数据库的DBA 需求分析 了解业务部门的需求,或者主动提出需求 ID分析 对生产系统
阅读全文
摘要:w
阅读全文
摘要:http://www.cs.jhu.edu/~rflorian/fntbl/
阅读全文
摘要:w https://support.office.com/en us/article/Choose between the 64 bit or 32 bit version of Office 2dee7807 8f95 4d0c b5fe 6c6f49b8d261
阅读全文
摘要:https://civic.mit.edu/blog/natematias/best practices for ethical gender research at very large scales
阅读全文
摘要:w http://deeplearning.stanford.edu/wiki/index.php/主成份分析 主成分分析(PCA)及其在R里的实现 - jicf的日志 - 网易博客 http://blog.163.com/xiaoji0106@126/blog/static/13613466120
阅读全文
摘要:数据开发常用的几种数据预处理和数据整理方法 https://mp.weixin.qq.com/s/Y8GQnj3bHzwq2LHCNMf6Cg 要点 在常见的机器学习/深度学习项目里,数据准备占去整个分析管道的60%到80%。 市场上有各种用于数据清洗和特征工程的编程语言、框架和工具。它们之间的功能
阅读全文