简介:新闻网页正文抽取,可提取互联网上99% 已上文章,智能识别包含的标题及正文内容。 互联网上几百万个站点,每个站点还有N个不同的文章页面模版,您只需要接入我们的接口,就无需再为编写获取文章内容的正则而苦恼了,直接提取标题及正文内容。
已连接应用数:2301
https://api.ip138.com/text/
https://api.ip138.com/text/
get
参数说明:
1. url string url地址(需转码)
2. type int 算法类型 1|2 1:适用文本类网站,2:适用图文类网站
3. token string 购买服务后会提供(必填)
curl "https://api.ip138.com/text/?url=http%3a%2f%2fwww.sina.com.cn%2f&type=1" -H "token:cc87f3c77747bccbaaee35006da1ebb65e0bad57"
参数说明:
1. url string url地址(需转码)
2. type int 算法类型 1|2 1:适用文本类网站,2:适用图文类网站
3. token string 购买服务后会提供(必填)
https://api.ip138.com/text/?url=http%3a%2f%2fwww.sina.com.cn%2f&type=1&token=cc87f3c77747bccbaaee35006da1ebb65e0bad57
说明:ret 值为 ok 时 返回data查询结果数据 为err时返回msg错误信息
{ "ret": "ok", // ret 值为 ok 时 返回 data 数据 为err时返回msg数据 "url": "http://www.test.com", // url "data": [ "标题", "正文", ] }
https://api.ip138.com/status/
get
1. token `string`
https://api.ip138.com/status/?token=cc87f3c77747bccbaaee35006da1ebb65e0bad57
{ "ret":"ok", "data":{ "reqs":10, //当前小时请求数 "hour":3000, //当前小时购买次数 "package":19767 //配额次数 } }