YahooArchive/anthelion
2,832
Anthelion is a plugin for Apache Nutch to crawl semantic annotations within HTML pages.
用于爬取HTML页面中语义注释的Apache Nutch插件
共 1052 个仓库
备份、整理、重新发现你曾点赞过的每一个 GitHub 仓库。
Anthelion is a plugin for Apache Nutch to crawl semantic annotations within HTML pages.
用于爬取HTML页面中语义注释的Apache Nutch插件