DNBC201504012CJFT1218基于Lucene构建的Web服务搜索引擎郑宇卫同济大学电子与信息工程学院计算机科学与技术系随着互联网的发展,Web服务作为一个崭新的分布式计算模型已经逐渐成为解决现实应用问题的重要技术。目前开发的Web服务数量逐渐增长,而且不仅局限于以WSDL标准发布的服务,Rest的服务也飞速发展。对这些开放的Web服务进行全面且有效的检索成为一个重要的问题。利用Scrapy爬虫框架抓取服务,利用Lucene针对Web服务的特殊文档格式进行有效索引,完整地提供了Web服务搜索引擎的设计。搜索引擎Web服务服务检索网络爬虫服务索引电脑编程技巧与维护201504TP391.3;TP393.09Web:5784;Lucene:4017;网络爬虫:843;分布式计算模型:812;文档格式:668;描述文件:463;服务数量:415;WSDL:376;搜索系统:261;分词系统:63;I;125INFO1503DNBCDNBC2015-02-18中文;I138DNBC201504