Logo
    立即注册
    图片版面分析
    最近更新时间:2024-06-18 15:13:34

    请求示例

    curl -i -XPOST -H 'Content-Type: application/json' \
    -H 'Authorization: your Authorization code here' \
    -d '{"url": "https://img-blog.csdnimg.cn/740c26c2b20d4ea9acf2ebc7def9b3f5.png#pic_center"}' \
    https://open.datastory.com.cn/api/thanos/ocr-layout
    • url为图片的链接地址

    响应示例

    {"bboxes":[{"bbox":[701,3,1278,854],"confidence":1.0,"label":"Table","polygon":[[701,3],[1278,3],[1278,854],[701,854]]},{"bbox":[21,41,593,815],"confidence":1.0,"label":"Table","polygon":[[21,41],[593,41],[593,815],[21,815]]}],"image_bbox":[0.0,0.0,1280.0,876.0],"page":1}
    • bboxes 包含所有解析出来的标签,例如 Figure,Text,table, image, header 等
      • polygon 表示边界框的四个点(左上、右上,右下,左下)
      • confidence 代表置信度(范围0-1,建议设置阈值过滤低置信度结果,推荐0.7),label 为输出的标签类型(重点关注 Figure 和 Text)
      • bbox 为最大外接矩形的框(左上、右下)
    • image_bbox 图片的大小
    • page 图片的页数

    失败场景

    • 状态码403
      {"error": 403, "msg": "图片无法正常下载"}
    • 状态码404
      {"error": 404, "msg": "未知错误,可能是输入的文件不合理"}
    • 状态码405
      {"error": 405, "msg": "输入的 url 有误"}

    图片尺寸限制

    为避免输入的图片过于极端(例如尺寸过大,以及长宽比不合理等),导致显存溢出,进而导致服务崩溃。这里将输入的尺寸面积约束在 397 X 14784(实测解决显存极限的输入最大面积) 以内,同时长宽比要小于 40:1

    微信扫描二维码在线咨询