网页提取接口文档网页内容抓取API接口文档 iP138查询网

API接口QQ交流群：177096428
数据修正QQ处理群：94181690

网页提取接口支持HTTPS（赠送100次）

简介：新闻网页正文抽取，可提取互联网上99% 已上文章，智能识别包含的标题及正文内容。互联网上几百万个站点，每个站点还有N个不同的文章页面模版，您只需要接入我们的接口，就无需再为编写获取文章内容的正则而苦恼了，直接提取标题及正文内容。

已连接应用数：2306

在线API申请

新闻网页正文提取接口文档说明

接口地址

https://api.ip138.com/text/
https://api.ip138.com/text/

请求方式

get

示例1（Linux命令行下执行）

参数说明:
1. url string url地址(需转码)
2. type int 算法类型 1|2 1：适用文本类网站，2：适用图文类网站
3. token string 购买服务后会提供（必填）

curl "https://api.ip138.com/text/?url=http%3a%2f%2fwww.sina.com.cn%2f&type=1" -H "token:cc87f3c77747bccbaaee35006da1ebb65e0bad57"

示例2

参数说明:
1. url string url地址(需转码)
2. type int 算法类型 1|2 1：适用文本类网站，2：适用图文类网站
3. token string 购买服务后会提供（必填）

https://api.ip138.com/text/?url=http%3a%2f%2fwww.sina.com.cn%2f&type=1&token=cc87f3c77747bccbaaee35006da1ebb65e0bad57

JSONP返回示例

说明：ret 值为 ok 时返回data查询结果数据为err时返回msg错误信息

{
    "ret": "ok",    // ret 值为 ok 时 返回 data 数据 为err时返回msg数据
    "url": "http://www.test.com",  // url
    "data": [
        "标题",     
        "正文",     
    ]
}

查询token使用情况

URL

https://api.ip138.com/status/

请求方式

get

参数

1. token `string`

示例

https://api.ip138.com/status/?token=cc87f3c77747bccbaaee35006da1ebb65e0bad57

响应

{
    "ret":"ok",
    "data":{
        "reqs":10,   //当前小时请求数
        "hour":3000, //当前小时购买次数
        "package":19767 //配额次数
    }
}