一直以来,我们在提到利用R举办数据阐明、数据挖掘城市利用RODBC、RJDBC、DBI等相关的包来挪用数据库,好比我前面罗嗦的一片文章数据挖掘之R与SQL,但实际根基上各大数据库厂商已有相应的R语言企业级应用产物,这些厂商包罗Oracle、IBM、Teradata、Sybase、SAP。
Oracle R Enterprise
Oracle R Enterprise是针对付大数据市场下,用于处理惩罚日益富厚的数据。这款产物有以下优势:
企业级的R应用
淘汰奋发SA$的利用用度
大数据阐明的in-database支持
众所周知,R语言将数据置于内存,数据处理惩罚本领有限,Oracle R Enterprise将此瓶颈完全打开,并将机能晋升到更高级别。
IBM Netezza®
Netezza 并不附属于IBM原有产物线,而是针对付“一体机”市场,于2010年17亿美元的价值收购得到,用以扩张其用于销售、市场营销和产物开拓的商务阐明产物。Netezza对R语言的支持,主要通过Revolution相助,通过挪用R Enterprise from Revolution® Analytics平台来实现。Netezza的特点可以总结为:可扩展的、高机能的、大局限内置并行阐明平台。
注:除了R语言外,Netezza还支持SAS、PASW等阐明软件
IBM® InfoSphere® BigInsights
IBM BigInsights 同样也整合了R语言资源,提供了Map-Reduce架构的R语言并行化计较情况,包罗了大数据集的文本挖掘和呆板进修算法。BigInsights可以将构建的R语言模子宣布在Hadoop平台上(同IBM Netezza一样,通过挪用R Enterprise from Revolution® Analytics),极大的满意企业级数据需求。
注:为IBM提供R语言贸易化应用的公司是Revolution,关于这家公司可以参考这里。
SAP HANA
借助SAP BusinessObjects Predictive Analysis平台,阐明师们既可以利用内置的预测性算法来构建模子,也可以整归并利用风行的开源数据统计阐明语言——R语言。而且,依托SAP HAHA平台可以提供in-database阐明。
Teradata
Teradata提供了免费的 teradataR 包,用于在R情况下毗连Teradata数据库、建设数据、条用in-database阐明函数。
Sybase RAP
Sybase RAP主要是针对付金融市场的及时阐明,个中RAPStore组件提供了内置阐明函数,包罗时间序列阐明函数、OLAP函数、R语言整合函数以及用户自界说函数,合用于大数据情况。
其挪用R函数的机理如下:
同时,还可以在R语言情况下通过RJDBC会见Sybase RAP,举办数据预处理惩罚,制止在R中数据清洗占用大量内存。