微软Azure实现了非结构化数据搜索
继微软Azure能够实现云数据库搜索后,微软现在开始把注意力转向非结构化数据。据国外媒体报道,应客户需求,微软发布了融了搜索引擎的Azure Blob Storage预览版。该服务是微软推出的基于云的非结构化数据存储服务。
微软Azure高级软件工程师表示:“微软 Azure SQL Database 和 DocumentDB 一直备受客户关注,同时很多客户对Azure Blob Storage的需求也非常强烈。”
加入索引器的目的是让客户自由地从“blob”中提取文本,并且涵盖任何格式。比如PDF的、DOC的或者XLS,以及其他难以解析的二进制文本。可以按照内容类型检测,也可以实现元数据提取。通过最优秀的搜索引擎工具,可以客户将所有内容集成到一个索引工作流中,同时为客户提供带代码级的基础设施服务。
Azure blob可以从PDF文件中提取文本和元数据。包括几个Office文档文件格式(比如:DOCX/DOC, XLSX/XLS, PPTX/PPT and MSG)。索引器也适用于HTML、XML、ZIP、EML,当然也包括纯文本文件。
他们的管理员也可通过Azure虚拟机(vm)建立新的日志分析能力。微软的新云管理解决方案地带来日志分析(OMS)能力,通过运营管理套件(OMS),用户可进入Azure门户,建立一个全新的网络工作空间。
在此前,微软Azure保持了在云计算存储性能测试上对亚马逊简单存储服务(S3)的领先优势。在一份针对云计算供应商速度与可用性基准测试的年度报告中,在云计算中写操作、读操作以及删除数据的性能测试中,微软超越亚马逊和谷歌表现最佳。此次微软对于非结构化数据的分析能力,将让微软Azure再上新台阶。