中文(多语种) 信息检索与文本分类系统
项目持有者:曾庆辉 联系方式:E-mail:zqhmail@yahoo.com 项目介绍: 信息检索和文本分类在通信和信息处理领域具有极广泛的应用。Xtramind技术有限公司综合机器学习和自然语言处理技术,提供基於主题和内容的文本智能处理。 大型模块集XM-MindSet集成了多项核心智能技术,包括超级文本分类(XM-XtraClass), 文本聚类(XM-Clustering) ,搜索引擎(XM-Finder), 索引导航(XM-IndexNavigator), 冗余识别(XM-DuplicateRecognition), 语种识别 (XM-LanguageIdentificaton),信息抽取(XM-InfoXtract),自动文本摘要(XM-Summary),文本格式转换 (XM-FormatConversion), 文本自动生成(XM-XtraGen)等功能模块。模块之间能各自独立,也能根据用户需要灵活地组合拼装。各模块在模块精度(查准查全) ,时间效率,广义化,鲁棒性,动态移植性等方面都表现卓越。 Xtramind技术有限公司在致力XM-MindSet的研究与开发同时,也在产品实际运营上积累了丰富经验。 如本分类方面,在为DIZ慕尼黑信息中心提供的分类解决方案中,XM-MindSet能成功高效地对文本进行多级和海量类别(单级最高达到14000类)的分类,Xtramind在众多的的项目竞投者中遥遥领先。如在信息检索方面,美国“911”事件之后,各国要求加强信息监控的力度。为此,Xtramind联合Thales公司开发了Web监控系统,Xtramind负责提供其智能处理核心模块。此监控系统能有效识别如阿拉伯人名、相关电话号码等敏感信息。目前,德国政府已将该软件用于信息安全部门,用来监控和寻找大量电子及网络信息中危害国家利益的信息源。德国情报部门将其用于“反恐”,特别是对非本国语言的“反恐”信息监控。 中国的信息化日益发达,各种文本数据,电子信息日益增多。如中国的手机持有者每年发出2200亿条短信,占全世界发出短信总数的一半。如何更好地对信息进行更好地处理分析,将在很多程度上影响到中国现代化的进程和社会的安全稳定。建议:XM-MindSet可用于各类信息中心作电子信息的分类和检索,用于公司、政府单位对竞争或敌对势力的信息自动监控,如国家信息安全部门,电信信息中心。 关于XM-MailMinder的详细介绍和成功案例请浏览Xtramind公司的网页:www.xtramind.com
|