最新评论
@大胃Q
恩。视频播放需求相同的项目应该很多,我这个项目目前还没有联通的展示面板相关的。
@干拔三分
谢谢提醒,因为项目用到的视频播放是辅助功能,并未深入研究到这种地步。
你有相关案例可参考一下么?
复杂的,自己demux解码,然后显示
更简单一点的,用ffmpeg框架,自己做外壳
更简单的,用mplayer的slave模式、或者采用vlc库
好东西,迷恋采集很多年了,一直没遇到弄图片的~学习一下
@wander112900
图片解析,因为知道商品ID后,可以直接下载价格图片而不去访问页面,这样在带宽限制下能最快地获取价格,再加上优化的识别算法,会加快解析速度。这样就比较适合单个服务器形式全局价格密集型采集了。
@wander112900
@熊猫发光
你们没看完我写的文章哈,我里面有两种识别方式:HTML和图片。各种识别利弊也分析了。而专门针对京东的价格图片识别是作为思想讨论的,重点在研究思想。
简单看了一下京东的页面,其实他的页面上本来就有价格的,点一下《推荐有礼》旁边的任意一个图标,上面不是很清楚的写着商品的价格和特点吗?还用那么费神去搞图片识别吗?
之前我们也采集过360buy的数据 后发现价格是图片。本以实现跟lz类似的功能的时候,我发现我错了。
原来在每件商品的HTML源码里面其实都已经包含了价格。
京东价:¥47.80。 哈哈
不过一些特价之类的商品HTML没有价格我们才会用解析图片的方式来实现。
@finesite
没有扭曲变形和加干扰点的没问题,否则就用3楼说的OCR技术
@superstar
讨论技术在这里就行了,京东的价格采集分析软件我没打算做哦,呵呵。
嗯 是的。OCR现在太成熟了,大概都是十几年前的东西了。现在都已经到体感了。嘿嘿。
@imfunny
恩,对比这两种实现方式意义也不是很大。当时我知道按形状去分析数字的原理是二值化然后分析形状,网上对这种技术都已经成熟或者成型了,我就本着研究的态度去自己想了如何识别,就出了这么一个结果,呵呵。
@Brush
我倒感觉京东的数据因为很规整,所以不管怎么实现都很快。
楼主用OCR去试试看。规范的数字快不到那里去的。
OCR不强调像素点,强调的只是反色点和形状。
@iTech
这个倒没使用什么强大的技术,主要是提供了另外一种能够快速解析京东价格图片的思路。
理论上说应该是最快的了,不知道有没有比这个还快的。
@imfunny
我这个是专门为京东做过优化的,理论上应该是识别速度最快的了(平均一个价格图片对比像素点29个)。提供了另外一种思路,呵呵。
这个也有。
http://www.cnblogs.com/imfunny/archive/2011/11/15/2250032.html
@6572789
我本身不做这个,拿出来也只是跟大家分享一下设计的思路而已,京东的价格采集是我业余时间做来玩的,毕竟本人经常在京东买东西,都成了金牌客户了。
@Brush
嗯,好在图像简单,稍复杂一点,要是“认”出来效率肯定有严重问题了
@芬达
是理论上的最高的采集图片效率了吧,平均一个数字只采取了五个左右的像素点就能”认“出来,呵呵。
@说不得
我这个是专门对京东图片采集做的优化,可以推广到”固定图片拼接“模式的图片识别,连识别逻辑过程都可以自动生成。
@吃西瓜最快
这个不难的,把图片切分好后,遍历每个数字的相同位置的像素,找出唯一不一样的就可以了
特征点抗干扰能力太差,可以参考我这篇文章使用余弦定理计算:
[url=http://www.cnblogs.com/mobydick/archive/2010/01/20/1652204.html]计算两张黑白图片的相似度[/url]
@NetSQL
现在京东的价格图片那道线已经没有了,抓取变得简单了些。
Re:关于网站应用中XML的使用心得[原创] 快乐八哥 2011-05-25 17:23
微软本身自己的Web开发,一般使用XML。用InfoPath生成XML。使用XSLT去做转换。
@紫色永恒
@nasa
@Codename.net
不知道你的是哪个版本, 是SL3么?
我当时创建的是SL应用程序, 然后在SL3的帮助文档里是没看到PointAnimationUsingPath这个类, 但写代码时就能写出来, 估计是官方的Bug(将SL应用程序扩充到了wpf层了), 尤其是我创建的SL应用程序, 啥也没做, 就是鼠标点击移动图形, 就要客户端安装Framework3.5sp1.
sl不支持PointAnimationUsingPath
不过有国外牛人已经实现相关功能了
Re:Silverlight3实现按路径运动[原创] Codename.net 2009-11-17 19:36
Silverlight根本就不支持PointAnimationUsingPath
不知道你的XmlDataDocument是怎么用的,我用ArrayList没有问题,不过需要指定可序列化才行,具体可以到我blog看看,上面有个例子
re: 关于网站应用中XML的使用心得[原创] baronbig@163.com 2008-03-20 19:07
@JoeLee 说的有一定的道理。
我在XML应用上没有多少经验,所以我只是说一下自己对XML的理解。
在系统框架设计上,XML更多的应作为分布式系统或异构型系统集合交换数据
的工具,更专业的讲应该是充分发挥XML在跨应用和服务器的数据交换优势,
降低网络的overhead。
在数据存储方面,XML作为存储数据的文件,可以做为数据库设计的一个辅助
方式,是程序设计更为简单灵活。