2019年8月11日

全网独发gensim中similarities.Similarity用法

摘要: index = similarities.MatrixSimilarity(lsi[corpus]) # 管网的原文翻译如下: 警告:similarities.MatrixSimilarity类仅仅适合能将所有的向量都在内存中的情况。例如,如果一个百万文档级的语料库使用该类,可能需要2G内存与256 阅读全文

posted @ 2019-08-11 23:00 耀扬 阅读(7470) 评论(0) 推荐(0)

一个非常有趣的爬虫小练习带ocr识别的

摘要: 有个小的想法,想找一找 形近字 。百度一搜索,百度文库有一个,收费4元。而且我觉得字数不是太多。想自己弄一个,于是找到了 这个网站 http://www.fantiz5.com/xingjinzi/ 这里面据说字数很多,开练! 主要是为了学习 chrome,开发者调试 发现 有个 zhuan() 的 阅读全文

posted @ 2019-08-11 19:58 耀扬 阅读(1221) 评论(0) 推荐(0)

python中ocr软件pytesseract使用

摘要: 首先要看原版的参考 https://github.com/madmaze/pytesseract 直接上代码, import pytesseractfrom PIL import Image image = Image.open(r'D:\xingjinzi\5.jfif') result =pyt 阅读全文

posted @ 2019-08-11 17:26 耀扬 阅读(2104) 评论(0) 推荐(0)

2019年8月10日

笔记本用hdmi连接显示器后无法播放声音问题

摘要: 打开控制面板的声音选项,把默认播放音频的设备设置成笔记本扬声器。这种方法直接利用笔记本扬声器 上述三个选项全部启用 阅读全文

posted @ 2019-08-10 21:58 耀扬 阅读(2911) 评论(0) 推荐(0)

2019年8月9日

一个多进程爬虫下载图片的demo

摘要: import os,re import pickle import requests import random import time from bs4 import BeautifulSoup from multiprocessing import Pool user_agent_list = 阅读全文

posted @ 2019-08-09 21:20 耀扬 阅读(311) 评论(0) 推荐(0)

一个爬虫的demo,requests,beatuifulsoup使用的

摘要: 爬虫的demo,requests,beatuifulsoup import os,re import requests import random import time from bs4 import BeautifulSoup user_agent_list = [ "Mozilla/5.0 ( 阅读全文

posted @ 2019-08-09 18:57 耀扬 阅读(223) 评论(0) 推荐(0)

2019年8月8日

720全景拍摄经历

摘要: 第一次准备拍摄720全景。决定自己亲自上。 首先研究硬件方案,觉得那些现成的全景相机不一定靠谱,觉得采用第二套方案,用普通的单反+云台 自己拍的方案。 1、硬件采购 从淘宝上买了720云的云台和脚架。在此必须说,720云的脚架不好。 这种脚架只能起到升高的作用,不能起到稳定的作用。镜头在不停的晃动, 阅读全文

posted @ 2019-08-08 17:56 耀扬 阅读(1043) 评论(0) 推荐(0)

python ocr中文识别库 tesseract安装及问题处理

摘要: 这个破东西,折腾了快1个小时,网上的教材太乱了。 我解决的主要是windows的问题 先下载exe。(一看到这个,我就有种预感,不妙) https://digi.bib.uni-mannheim.de/tesseract/ 选好自己的机型, 最新版的,可能会采坑啊 安装时可以添加支持的语言包,如下界 阅读全文

posted @ 2019-08-08 17:50 耀扬 阅读(6189) 评论(0) 推荐(0)

2019年8月5日

python写文件无法换行的问题

摘要: python写文件无法换行的问题,用'\n' 不行,直接打印的出来了。 网上查了查,都说是用 ‘\r\n’ ,但是这样打出来,不仅换行了,还加了一个空行。 windows平台最后结果是 直接用 '\r‘ 亲测有效 阅读全文

posted @ 2019-08-05 11:07 耀扬 阅读(1514) 评论(0) 推荐(0)

2019年8月1日

简单理解:协程、线程、进程

摘要: 1、进程 进程就像是 多开几个word,各运行各的。可以充分利用多核cpu 2、线程 线程就像是浏览器里多开几个页面,各运行各的,但都是在同一个浏览器的进程下的。可以充分利用cpu主观能动机制 但是由于cpu的轮转执行的,也就是说,cpu是假的并行执行,而是 执行1秒a进程,再执行一秒b进程,再执行 阅读全文

posted @ 2019-08-01 23:01 耀扬 阅读(197) 评论(0) 推荐(0)

2019年7月27日

一个超实用的python爬虫功能使用 requests BeautifulSoup

摘要: 一个简单的数据爬取的示例 import os,re import requests import random import time from bs4 import BeautifulSoup user_agent_list = [ "Mozilla/5.0 (Windows NT 6.1; WO 阅读全文

posted @ 2019-07-27 23:18 耀扬 阅读(566) 评论(0) 推荐(0)

2019年7月21日

Excel 2010同时打开2个或多个独立窗口

摘要: 亲测有效 参考下面的网址 https://jingyan.baidu.com/article/86fae346acca7d3c49121ad4.html 1、 在win+r 输入框里面输入“regedit.exe”打开注册表 2、找到该路径HKEY_CLASSES_ROOT \ Excel.Shee 阅读全文

posted @ 2019-07-21 15:03 耀扬 阅读(2987) 评论(0) 推荐(0)

华硕笔记本重装系统

摘要: 一个华硕笔记本要重做系统。太苦逼了。各种问题啊 各种坑。 一定要记录下来,方便大家。现在的破电脑装机太麻烦了。客服说装机100元。这钱我不能花啊,丢人啊。 一、win7导致触摸盘无法使用。 开始时装的win7,装完后 发现, 触摸盘 无法使用了。连bios里都无法使用了,根本找不到触摸盘了。后来上官 阅读全文

posted @ 2019-07-21 14:47 耀扬 阅读(1958) 评论(0) 推荐(0)

2019年7月17日

sense chrome扩展工具安装问题

摘要: 下载一个chrome的插件,只能在国内下了。有个什么插件网 。下载完之后是 .crx 格式的。直接拖到 chrome的扩展工具里,显示,插件有问题。无语 参考了一个网上的教程。 1、先将扩展名 .crx 直接改成 .zip 2、然后 解压 成一个文件夹 3、用 加载已解压的扩展程序 选择这个文件夹 阅读全文

posted @ 2019-07-17 12:05 耀扬 阅读(607) 评论(0) 推荐(0)

2019年7月16日

基于windows平台搭建elasticsearch 补充

摘要: https://www.cnblogs.com/skychen1218/p/8108860.html 参考此大神写的内容,感谢感谢。 不过 好像漏掉了一块内容。 导致出现问题 连接不上的问题。后来修改了xml文件 ,又出现了下面的问题 # Elasticsearch Configuration ## 阅读全文

posted @ 2019-07-16 16:39 耀扬 阅读(224) 评论(0) 推荐(0)

导航