功能说明
识别图片所包含的全部字段,支持表格识别、手写识别、旋转识别、生僻字识别并结构化输出
1.本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式
2.图片长宽需要大于 20 像素,小于 8192 像素。文件大小请勿超过2M
3.保证整票据内容及其边缘包含在图像内
密钥传递方式
密钥token可以通过url参数传递,也可以通过httpheader设置token,url设置的token优先httpheader设置的token
url方式:比如调用地址 http://api.konpn.com:10002/ocrtext/advanced?token=密钥token
httpheader方式:key="Authorization" value= "密钥Token"
通用文本识别Ocr
接口地址:http://api.konpn.com:10002/ocrtext/advanced?url=&charinfo=0&tableinfo=0&nostamp=0
请求方式:post
返回类型:json
请求参数:
| 名称 |
类型 |
必填 |
说明 |
| url |
string |
否 |
网络图片url,通过url传递(body和url二者选填一,url参数优先) |
| body |
stream |
否 |
图片stream,直接填入request stream(body和url二者选填一,url参数优先) |
| token |
string |
是 |
您的密钥 |
| charinfo |
int |
否 |
是否输出单字信息,0否1是,默认0 |
| tableinfo |
int |
否 |
是否输出表格信息,0否1是,默认0 |
| nostamp |
int |
否 |
是否忽略印章,0否1是,默认0 |
返回参数:
| 名称 |
类型 |
输出 |
说明 |
| RequestId |
string |
是 |
调用序号Id |
| Code |
int |
是 |
调用结果,=0调用成功,其他失败失败原因参考Msg |
| Msg |
string |
是 |
失败信息 |
| Data |
OcrResult |
是 |
结构如下表 |
|
| 名称 |
类型 |
输出 |
说明 |
| content | string | - | 图片文字汇总 |
| wordsInfo | list | - | 单字信息序列,charinfo=1时输出,元素结构如下表 |
|
| 名称 |
类型 |
必填 |
说明 |
| angle | int | - | 文字块的角度 |
| word | string | - | 文字块的文字内容 |
| tableId | int | - | 表格的 id,tableinfo=1时输出 |
| tableCellId | int | - | 表格中单元格的 id,tableinfo=1时输出 |
| pos | list | - | 位置信息,左上、右上、右下、左下4个元素,结构如下表 |
|
| 名称 |
类型 |
必填 |
说明 |
| x | int | - | x坐标 |
| y | int | - | y坐标 |
|
|
| tablesInfo | list | - | 表格信息序列,tableinfo=1时输出,元素结构如下表 |
|
| 名称 |
类型 |
必填 |
说明 |
| tableId | int | - | 表格 id |
| xCellSize | int | - | 表格中横坐标格的数量 |
| yCellSize | int | - | 表格中纵坐标格的数量 |
| cellInfos | list | - | 单元格信息,元素结构如下 |
|
| 名称 |
类型 |
必填 |
说明 |
| tableCellId | int | - | 单元格 id |
| word | string | - | 单元格中的文字 |
| xsc | int | - | 横轴方向该单元格序号,第一单元格为0 |
| ysc | int | - | 纵轴方向该单元格序号,第一单元格为0 |
|
|
| paragraphsInfo | list | - | 段落信息序列,元素结构如下表 |
|
| 名称 |
类型 |
必填 |
说明 |
| paragraphId | int | - | 段落 id |
| word | string | - | 段落文字 |
|
| |
| imginfo | object | 是 | 图片信息,结构如下 |
|
| 名称 |
类型 |
必填 |
说明 |
| width | int | 是 | 算法矫正图片后的宽度 |
| height | int | 是 | 算法矫正图片后的高度 |
| orgWidth | int | 是 | 原图的宽度 |
| orgHeight | int | 是 | 原图的高度 |
|
|
请求范例:
返回范例: