AI图像识别

使用百度AI图像识别提供的API接口来搭建识图工具，首先要注册百度开发者账号，然后找到图像识别页面，创建应用，申请成功后会给两个重要的数据API Key ，Secret Key，这是实现识图的重要参数，以动物识别为例：

获取access_token接口

import urllib, urllib2, sys
import ssl

# client_id 为官网获取的AK， client_secret 为官网获取的SK
host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【官网获取的AK】&client_secret=【官网获取的SK】'
request = urllib2.Request(host)
request.add_header('Content-Type', 'application/json; charset=UTF-8')
response = urllib2.urlopen(request)
content = response.read()
if (content):
    print(content)

识别图像接口

这是百度给的请求方法，返回的content是json数据格式，需要使用loads方法转换为Python对象，token的获取也给了方法可以调用

# encoding:utf-8
import base64
import urllib
import urllib2

'''
动物识别
'''

request_url = "https://aip.baidubce.com/rest/2.0/image-classify/v1/animal"

# 二进制方式打开图片文件
f = open('[本地文件]', 'rb')
img = base64.b64encode(f.read())

params = {"image":img,"top_num":6}
params = urllib.urlencode(params)

access_token = '[调用鉴权接口获取的token]'
request_url = request_url + "?access_token=" + access_token
request = urllib2.Request(url=request_url, data=params)
request.add_header('Content-Type', 'application/x-www-form-urlencoded')
response = urllib2.urlopen(request)
content = response.read()
if content:
    print content

制作识图工具使用Pyqt5这个模块，也比较简单

import sys
from PyQt5 import QtWidgets, QtCore
from PyQt5.QtGui import *
from PyQt5.QtWidgets import *
from PyQt5.QtCore import *
from PyQt5.QtWidgets import QFileDialog

import json
import base64
import urllib
import urllib.request

""" 你的 APPID AK SK """
# http://ai.baidu.com/docs#/OCR-Pricing/top 申请地址

# API_KEY 为官网获取的AK， SECRET_KEY 为官网获取的SK


API_KEY = 'API_KEY'
SECRET_KEY = 'SECRET_KEY'

#qt自动生成的UI类
class Ui_Form(object):
    def setupUi(self, Form):
        #设置窗体名称
        Form.setObjectName("Form")
        # 设置窗体大小
        Form.resize(724, 489)
        # 创建显示要识别图片控件
        self.image = QtWidgets.QLabel(Form)
        # 设置控件大小
        self.image.setGeometry(QtCore.QRect(96, 140, 311, 301))
        # 设置黑色边框
        self.image.setStyleSheet("border-width: 1px;border-style: solid;border-color: rgb(0, 0, 0);")
        # 设置图片显示控件名称
        self.image.setObjectName("image")
        # 创建窗体
        self.widget = QtWidgets.QWidget(Form)
        # 窗体大小
        self.widget.setGeometry(QtCore.QRect(110, 50, 221, 31))
        # 设置名称
        self.widget.setObjectName("widget")
        # 创建布局容器控件
        self.horizontalLayout = QtWidgets.QHBoxLayout(self.widget)
        # 设置容器中内容边距
        self.horizontalLayout.setContentsMargins(0, 0, 0, 0)
        # 设置名称
        self.horizontalLayout.setObjectName("horizontalLayout")
        # 创建文字显示控件
        self.label = QtWidgets.QLabel(self.widget)
        # 设置名称
        self.label.setObjectName("label")
        # 把文字显示控件添加到布局容器中
        self.horizontalLayout.addWidget(self.label)
        # 在窗体里创建选择内容控件
        self.comboBox = QtWidgets.QComboBox(self.widget)
        # 设置名称
        self.comboBox.setObjectName("comboBox")
        # 添加子标题有多少分类添加几个
        self.comboBox.addItem("")
        self.comboBox.addItem("")
        self.comboBox.addItem("")
        self.comboBox.addItem("")
        self.comboBox.addItem("")
        self.comboBox.addItem("")
        self.comboBox.addItem("")
        self.comboBox.addItem("")
        self.comboBox.addItem("")
        self.comboBox.addItem("")
        self.comboBox.addItem("")
        # 把下拉选择控件添加到布局容器中
        self.horizontalLayout.addWidget(self.comboBox)
        # 创建窗体
        self.widget1 = QtWidgets.QWidget(Form)
        # 创建窗体大小
        self.widget1.setGeometry(QtCore.QRect(96, 90, 318, 31))
        # 创建名称
        self.widget1.setObjectName("widget1")
        # 新建横向布局
        self.horizontalLayout_2 = QtWidgets.QHBoxLayout(self.widget1)
        self.horizontalLayout_2.setContentsMargins(0, 0, 0, 0)
        self.horizontalLayout_2.setObjectName("horizontalLayout_2")
        self.label_2 = QtWidgets.QLabel(self.widget1)
        self.label_2.setObjectName("label_2")
        self.horizontalLayout_2.addWidget(self.label_2)
        self.lineEdit = QtWidgets.QLineEdit(self.widget1)
        self.lineEdit.setObjectName("lineEdit")
        self.horizontalLayout_2.addWidget(self.lineEdit)
        # 新建按钮
        self.pushButton = QtWidgets.QPushButton(self.widget1)
        self.pushButton.setObjectName("pushButton")
        self.horizontalLayout_2.addWidget(self.pushButton)
        self.widget2 = QtWidgets.QWidget(Form)
        self.widget2.setGeometry(QtCore.QRect(450, 50, 201, 401))
        self.widget2.setObjectName("widget2")
        self.verticalLayout = QtWidgets.QVBoxLayout(self.widget2)
        self.verticalLayout.setContentsMargins(0, 0, 0, 0)
        self.verticalLayout.setObjectName("verticalLayout")
        self.label_3 = QtWidgets.QLabel(self.widget2)
        self.label_3.setLayoutDirection(QtCore.Qt.LeftToRight)
        # 设置内容自动换行
        self.label_3.setWordWrap(True)
        # 设置黑色边框
        self.label_3.setStyleSheet("border-width: 1px;border-style: solid;border-color: rgb(0, 0, 0);")
        self.label_3.setObjectName("label_3")
        self.verticalLayout.addWidget(self.label_3)
        self.pushButton_2 = QtWidgets.QPushButton(self.widget2)
        self.pushButton_2.setObjectName("pushButton_2")
        self.verticalLayout.addWidget(self.pushButton_2)
        # 自动生成的ui控件 处理方法
        self.retranslateUi(Form)
        # 自动生成的  关联信号槽
        QtCore.QMetaObject.connectSlotsByName(Form)

    def retranslateUi(self, Form):
        _translate = QtCore.QCoreApplication.translate
        # 设置窗体内容
        Form.setWindowTitle(_translate("Form", "图像识别工具"))
        # 设置文字控件显示内容
        self.label.setText(_translate("Form", "选择识别类型："))
        # 设置下拉控件选项内容
        self.comboBox.setItemText(0, _translate("Form", "菜品"))
        self.comboBox.setItemText(1, _translate("Form", "植物"))
        self.comboBox.setItemText(2, _translate("Form", "动物"))
        self.comboBox.setItemText(3, _translate("Form", "通用物体和场景"))
        self.comboBox.setItemText(4, _translate("Form", "红酒"))
        self.comboBox.setItemText(5, _translate("Form", "货币"))
        self.comboBox.setItemText(6, _translate("Form", "花卉"))
        self.comboBox.setItemText(7, _translate("Form", "果蔬类食材"))
        self.comboBox.setItemText(8, _translate("Form", "地标"))
        self.comboBox.setItemText(9, _translate("Form", "车型"))
        self.comboBox.setItemText(10, _translate("Form", "Logo"))
        # 设置控件显示文字
        self.label_2.setText(_translate("Form", "选择要识别的图片："))
        # 设置按钮显示的文字
        self.pushButton.setText(_translate("Form", "选择..."))
        # 设置文本控件显示内容
        self.label_3.setText(_translate("Form", "显示识别结果"))
        # 设置按钮内容
        self.pushButton_2.setText(_translate("Form", "复制到剪切版"))
        # 为按钮设置方法
        self.pushButton.clicked.connect(self.openfile)
        # 为按钮设置点击方法
        self.pushButton_2.clicked.connect(self.copyText)
    # 复制文字到剪贴板方法
    def copyText(self):
        # 复制文字到剪贴板
        clipboard = QApplication.clipboard()
        # 设置复制的内容
        clipboard.setText(self.label_3.text())
    # 打开文件选择对话框方法
    def openfile(self):
        # 启动选择文件对话空，查找jpg以及png图片
        self.download_path = QFileDialog.getOpenFileName(self.widget1, "选择要识别的图片", "/", "Image Files(*.jpg *.png)")
        # 判断是否选择图片
        if not self.download_path[0].strip():
            # 没有选择图片
            pass
        else:
            # 选择图片执行以下内容
            # 设置图片路径
            self.lineEdit.setText(self.download_path[0])
            # 理由pixmap解析图片
            pixmap = QPixmap(self.download_path[0])
            # 等比例缩放图片
            scaredPixmap = pixmap.scaled(QSize(311, 301), aspectRatioMode=Qt.KeepAspectRatio)
            # 设置图片
            self.image.setPixmap(scaredPixmap)
            # 判断选择的类型 根据类型做相应的图片处理
            self.image.show()
            # 判断选择的类型
            self.typeTp()
            pass

    # 判断选择的类型 进行相应处理
    def typeTp(self):
        # 菜品识别
        if self.comboBox.currentIndex() == 0:
            #self.get_bankcard(self.get_token())
            self.get_dishDetect(self.get_token())
            pass
        # 植物识别
        elif self.comboBox.currentIndex() == 1:
            self.get_plant(self.get_token())
            pass
        # 动物识别
        elif self.comboBox.currentIndex() == 2:
            self.get_animal(self.get_token())
            pass
        #通用识别
        elif self.comboBox.currentIndex() == 3:
            self.get_advanced_general(self.get_token())
            pass
        # 红酒识别
        elif self.comboBox.currentIndex() == 4:
            self.get_redwine(self.get_token())
            pass
        # 货币识别
        elif self.comboBox.currentIndex() == 5:
            self.get_currency(self.get_token())
            pass
        # 花卉识别
        elif self.comboBox.currentIndex() == 6:
            self.get_flower(self.get_token())
            pass
        # 果蔬类识别
        elif self.comboBox.currentIndex() == 7:
            self.get_ingredient(self.get_token())
            pass
        # 地标识别
        elif self.comboBox.currentIndex() == 8:
            self.get_landmark(self.get_token())
            pass
        # 车型识别
        elif self.comboBox.currentIndex() == 9:
            self.get_car(self.get_token())
            pass
        # Logo识别
        elif self.comboBox.currentIndex() == 10:
            self.get_logo(self.get_token())
            pass
        pass

    # 百度提供方法 获取token
    def get_token(self):
        # client_id 为官网获取的AK， client_secret 为官网获取的SK
        host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + API_KEY + '&client_secret=' + SECRET_KEY
        # 发送请求
        request = urllib.request.Request(host)
        # 添加请求头
        request.add_header('Content-Type', 'application/json; charset=UTF-8')
        # 获取返回内容
        response = urllib.request.urlopen(request)
        # 读取返回内容
        content = response.read()
        # 判断内容是否为空
        if (content):
            # 打印内容
            print(content)
            # 打印token
            print(json.loads(content)['access_token'])
            # 使用json解析出token 设置token
            self.access_token = json.loads(content)['access_token']
            # 返回token
            return self.access_token
    #菜品识别
    def get_dishDetect(self, access_token):
        request_url = "https://aip.baidubce.com/rest/2.0/image-classify/v2/dish"
        # 二进制方式打开图片文件
        f = self.get_file_content(self.download_path[0])
        img = base64.b64encode(f)
        params = {"image": img,"top_num":5}
        params = urllib.parse.urlencode(params).encode('utf-8')
        request_url = request_url + "?access_token=" + access_token
        request = urllib.request.Request(url=request_url, data=params)
        request.add_header('Content-Type', 'application/x-www-form-urlencoded')
        response = urllib.request.urlopen(request)
        content = response.read()
        if content:
            # 解析返回数据
            dishDetect = json.loads(content)
            # 输出返回结果
            strover = '识别结果：\n'
            # 捕捉异常判断是否正确返回信息
            try:
                # i = 1
                # for dish in dishDetect['result']:
                #     strover += '{} 菜名：{} \n  卡路里：{} \n'.format(i, dish['name'], dish['calorie'])
                #     i += 1
                dish_result=dishDetect['result']
                # 名称
                name = dish_result[0]['name']
                strover += ' 名称：\n  {} \n '.format(name)
                # 能量
                calorie = dish_result[0]['calorie']
                strover += ' 卡路里：{} \n '.format(calorie)
              

            # 错误的时候提示错误原因
            except BaseException:
                error_msg = dish_result['error_msg']
                strover += '  错误：\n {} \n '.format(error_msg)
            # 设置识别显示结果
            self.label_3.setText(strover)
    # 1植物识别
    def get_plant(self, access_token):
        request_url = "https://aip.baidubce.com/rest/2.0/image-classify/v1/plant"
        # 二进制方式打开图片文件
        f = self.get_file_content(self.download_path[0])
        # 转换图片
        img = base64.b64encode(f)
        # 拼接图片参数
        params = {"image": img}
        params = urllib.parse.urlencode(params).encode('utf-8')
        # 请求地址
        request_url = request_url + "?access_token=" + access_token
        # 发送请求传递图片参数
        request = urllib.request.Request(url=request_url, data=params)
        # 添加访问头部
        request.add_header('Content-Type', 'application/x-www-form-urlencoded')
        # 接收返回内容
        response = urllib.request.urlopen(request)
        # 读取返回内容
        content = response.read()
        #print(content)
        # 内容判断
        if content:
            plants = json.loads(content)
            strover = '识别结果：\n'
            try:
                i = 1
                for plant in plants['result']:
                    strover += '{} 植物名称：{} \n'.format(i, plant['name'])
                    i += 1
            except BaseException:
                error_msg = plants['error_msg']
                strover += '  错误：\n {} \n '.format(error_msg)
            self.label_3.setText(strover)
    # 2动物识别
    def get_animal(self, access_token):
        request_url = "https://aip.baidubce.com/rest/2.0/image-classify/v1/animal"
        # 二进制方式打开图片文件
        f = self.get_file_content(self.download_path[0])
        img = base64.b64encode(f)
        params = {"image": img, "top_num": 6}
        params = urllib.parse.urlencode(params).encode('utf-8')
        request_url = request_url + "?access_token=" + access_token
        request = urllib.request.Request(url=request_url, data=params)
        request.add_header('Content-Type', 'application/x-www-form-urlencoded')
        response = urllib.request.urlopen(request)
        content = response.read()
        if content:
            animals = json.loads(content)
            strover = '识别结果：\n'
            try:
                i = 1
                for animal in animals['result']:
                   strover += '{} 动物名称：{} \n'.format(i, animal['name'])
                   i += 1
            except BaseException:
                error_msg = animals['error_msg']
                strover += '  错误：\n {} \n '.format(error_msg)
            self.label_3.setText(strover)
    # 3 通用物体识别
    def get_advanced_general(self, access_token):
        request_url = "https://aip.baidubce.com/rest/2.0/image-classify/v2/advanced_general"
        # 二进制方式打开图片文件
        f = self.get_file_content(self.download_path[0])
        img = base64.b64encode(f)
        params = {"image": img}
        params = urllib.parse.urlencode(params).encode('utf-8')
        request_url = request_url + "?access_token=" + access_token
        request = urllib.request.Request(url=request_url, data=params)
        request.add_header('Content-Type', 'application/x-www-form-urlencoded')
        response = urllib.request.urlopen(request)
        content = response.read()
        if content:
            general_result = json.loads(content)
            strover = '识别结果：\n'
            try:
                i=1
                for general in general_result['result']:
                    #票据内容
                    root =general['root']
                    keyword=general['keyword']
                    strover += '{} 物体标签：{} \n  物体名称：{} \n'.format(i, root, keyword)
                    i+=1
            except BaseException:
                error_msg = general_result['error_msg']
                strover += '  错误：\n {} \n '.format(error_msg)
            self.label_3.setText(strover)
    
    #4红酒识别
    def get_redwine(self,access_token):
        request_url = "https://aip.baidubce.com/rest/2.0/image-classify/v1/redwine"
        # 二进制方式打开图片文件
        f = self.get_file_content(self.download_path[0])
        img = base64.b64encode(f)
        params = {"image": img}
        params = urllib.parse.urlencode(params).encode('utf-8')
        request_url = request_url + "?access_token=" + access_token
        request = urllib.request.Request(url=request_url, data=params)
        request.add_header('Content-Type', 'application/x-www-form-urlencoded')
        response = urllib.request.urlopen(request)
        content = response.read()
        if content:
            redwine = json.loads(content)
            strover = '识别结果：\n'
            hasdetail=redwine['result']['hasdetail']
            try:
                wine_result=redwine['result']
                if hasdetail==0:
                    
            #print(wine_result)
                    wineNameCn = wine_result['wineNameCn']
                    strover += ' 名称：\n  {} \n '.format(wineNameCn)
                else:
                    # 红酒名称
                    wine_name = wine_result['subRegionCn']
                    strover += ' 名称：\n  {} \n '.format(wine_name)
                    # 红酒品牌
                    wineNameCn = wine_result['wineNameCn']
                    strover += ' 品牌：{} \n '.format(wineNameCn)
                    # 颜色
                    color = wine_result['color']
                    strover += '  颜色：{} \n '.format(color)
                    # 类型
                    classifyBySugar = wine_result['classifyBySugar']
                    strover += '  类型：{} \n '.format(classifyBySugar)
                    # 温度
                    tasteTemperature = wine_result['tasteTemperature']
                    strover += '  温度：{} \n '.format(tasteTemperature)
                    # 地址
                    countryCn = wine_result['countryCn']
                    strover += '  地址：\n{}\n '.format(countryCn)
                    #描述
                    description = wine_result['description']
                    strover += '  描述：\n{}\n '.format(description)
            except BaseException:
                error_msg=wine_result['error_msg']
                strover += '  错误：\n  {} \n '.format(error_msg)
            self.label_3.setText(strover)         

    # #5 货币识别
    def get_currency(self, access_token):
        request_url = "https://aip.baidubce.com/rest/2.0/image-classify/v1/currency"
        # 二进制方式打开图片文件
        f = self.get_file_content(self.download_path[0])
        img = base64.b64encode(f)
        params = {"image": img}
        params = urllib.parse.urlencode(params).encode('utf-8')
        request_url = request_url + "?access_token=" + access_token
        request = urllib.request.Request(url=request_url, data=params)
        request.add_header('Content-Type', 'application/x-www-form-urlencoded')
        response = urllib.request.urlopen(request)
        content = response.read()
        if content:
            currency = json.loads(content)
            strover = '识别结果：\n'
            try:
                currency_result = currency['result']
                
                currencyName = currency_result['currencyName']
                strover += '  货币类型：\n{} \n '.format(currencyName)
                # 民族
                year = currency_result['year']
                strover += '  年份：{} \n '.format(year)
                # 面值
                currencyDenomination = currency_result['currencyDenomination']
                strover += '  姓名：{} \n '.format(currencyDenomination)
            except BaseException:
                error_msg = currency_result['error_msg']
                strover += '  错误：\n  {} \n '.format(error_msg)
            # 显示识别结果
            self.label_3.setText(strover)

    # 读取图片
    def get_file_content(self, filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()

# 程序主方法
if __name__ == '__main__':
    app = QtWidgets.QApplication(sys.argv)
    MainWindow = QtWidgets.QMainWindow()
    # 初始化窗体
    ui = Ui_Form()
    # 调用创建窗体方法
    ui.setupUi(MainWindow)
    # 显示窗体
    MainWindow.show()
    sys.exit(app.exec_())

View Code

posted @ 2019-07-12 14:19 橘子先生123 阅读(2847) 评论(1) 收藏举报

刷新页面返回顶部

橘子先生123

AI图像识别

公告