京东商城(360Buy)价格识别 java版

上一篇介绍到 利用Jsoup抓取各个电商网站的信息

不过有时候会遇到价格是图片的问题

这时候你只能得到一张图片了

如果有个能把图片解析出来那该多爽啊

去百度一搜“京东(360Buy)价格识别”  还真有

猪八戒上有人还发布任务了,不过那都是老早以前的了

网上有好多版本,

我自己也做了一个java版的

识别率 99.9%

我们相信java的强大,不过怕涉及到侵权问题,源码我就不贴了 需要学习的可以留邮箱,我发给你

这里我只讲思路

(1)首先你的会切图 用java

   下面给个小例子:

   这个是个切图的方法,x,y 是原来图片要切割的起始坐标, wight 和hight 是 要切割的宽和高, img 是原图的流

   这是一个队Png 后缀的图的切割方法,也是后一个抠图的方法,

  如果想切割jpg 的 的话,可以把两句改改

=============

BufferedImage.TYPE_INT_RGB

PNG

================

BufferedImage newImage = new BufferedImage(wight, hight,  BufferedImage.TYPE_INT_ARGB);
 ImageIO.write(newImage, "PNG", new File(x + "_" + y + "_" + wight
                   
+ "_.png"));

public static BufferedImage cat(int x, int y, int wight, int hight,
            BufferedImage img) {
        int[] simgRgb = new int[wight * hight];
        img.getRGB(x, y, wight, hight, simgRgb, 0, wight);
        BufferedImage newImage = new BufferedImage(wight, hight,
                BufferedImage.TYPE_INT_ARGB);
        newImage.setRGB(0, 0, wight, hight, simgRgb, 0, wight);
        try {
            ImageIO.write(newImage, "PNG", new File(x + "_" + y + "_" + wight
                    + "_.png"));
        } catch (IOException e) {
            e.printStackTrace();
        }
        return newImage;
    }

 (2)会对图片做索引

   对图片做索引我前面讲过了

 (3) 将网上抓来的价格图片切割后在你的索引里查询,

(4) 将返回的第一个字记录下来

最后输出结果 下面是我贴的部分结果:

ps:由于京东价格在不断变化的,这个例子已经失效了,上面的图片地址有的已经不存在了,程序修改了下,还是可以用的

http://price.360buyimg.com/gp1005187106,1.png
图片链接错误,请查证!!!!
http://price.360buyimg.com/gp1006754125,1.png
144.00
http://price.360buyimg.com/gp635281,1.png
348.00
http://price.360buyimg.com/gp1006749154,1.png
229.00
http://price.360buyimg.com/gp1002462797,1.png
图片链接错误,请查证!!!!
http://price.360buyimg.com/gp1003198953,1.png
168.00
http://price.360buyimg.com/gp247723,1.png
图片链接错误,请查证!!!!
http://price.360buyimg.com/gp1005973369,1.png
220.00
http://price.360buyimg.com/gp1005258226,1.png
175.00
http://price.360buyimg.com/gp635260,1.png
318.00
http://price.360buyimg.com/gp412666,1.png
64.00
http://price.360buyimg.com/gp1006702266,1.png
229.00
http://price.360buyimg.com/gp1005973327,1.png
220.00
http://price.360buyimg.com/gp623242,1.png
67.00
http://price.360buyimg.com/gp623244,1.png
191.00
http://price.360buyimg.com/gp333428,1.png
318.00
http://price.360buyimg.com/gp285159,1.png
266.00
http://price.360buyimg.com/gp1005186888,1.png
图片链接错误,请查证!!!!
http://price.360buyimg.com/gp412669,1.png
175.00
http://price.360buyimg.com/gp623246,1.png
195.00
http://price.360buyimg.com/gp247729,1.png
图片链接错误,请查证!!!!
http://price.360buyimg.com/gp252585,1.png
66.00
http://price.360buyimg.com/gp252586,1.png
178.00
http://price.360buyimg.com/gp668124,1.png
63.00
http://price.360buyimg.com/gp668119,1.png
174.00
http://price.360buyimg.com/gp412663,1.png
179.00
http://price.360buyimg.com/gp300728,1.png
83.80
http://price.360buyimg.com/gp623208,1.png
104.00
http://price.360buyimg.com/gp300731,1.png
208.00
http://price.360buyimg.com/gp344861,1.png

 测试结果太给力了,99.9999999999999%的准确性

 由于好多人问我要,我也不经常上博客,留下下载地址

 下载点这里

 

posted @ 2013-01-04 16:05  杨桃  阅读(1784)  评论(11编辑  收藏  举报