Mit der Neuerung wird das Hadoop-Ecosystem mit Graph-Analysefunktionen für Apache Spark - der weit verbreiteten In-Memory Analyse Engine - erweitert
(firmenpresse) - München, 24. Oktober 2017 - Neo4j, der Marktführer für Connected Data, stellt dem openCypher-Projekt ab sofort eine frühe Version des Language Toolkits Cypher for Apache Spark (CAPS) zur Verfügung. Big-Data-Analysten können damit leichter Graph-Abfragen in ihren Workflows nutzen, Graph-Algorithmen einbinden und Verbindungen innerhalb ihrer Daten besser aufdecken. Nach SAP HANA, Redis, AgensGraph und Neo4j unterstützt damit nun auch Apache Spark die deklarative Graph-Abfragesprache Cypher. Damit stehen Entwicklern weitere Tools unter der Apache 2.0 Lizenz innerhalb des openCyper-Projekts zur Verfügung.
Angesichts der wachsenden Bedeutung von graphbasierten Anwendungen und Analyse-Projekten möchten Big-Data-Analysten zunehmend die Verknüpfungen zwischen verschiedenen Daten analysieren und verstehen. Beispielhaft hierfür sind eBay mit ihrem Empfehlungssystem sowie Telia und Comcast im Bereich Smart Home.
Data Scientists konnten Graph Pattern Matching bei der Nutzung von Spark bislang nicht uneingeschränkt nutzen. Mit Cypher for Apache Spark wird dies künftig einfacher . Existierende Datenquellen lassen viel schneller mit Graph-Anwendungen verbinden.
"Cypher for Apache Spark ist ein wichtiger Schritt, um die Verbreitung der Graphtechnologie sowie die Entwicklung von Cypher als universelle Abfragesprache weiter voranzutreiben", erklärt Philip Rathle, Vice President of Products bei Neo4j. "Um Cypher für Apache Spark verfügbar zu machen, haben wir uns angesehen, wie Spark mit unveränderlichen Datensätzen arbeitet. In Abstimmung mit der openCypher Community haben wir die Möglichkeit geschaffen, Graphabfragen über die Ergebnisse von vorherigen Graphabfragen durchzuführen. Eine API erlaubt es, Graphen aufzuteilen, zu transformieren, oder in verschiedenen Versionen festzuhalten und solche Graphen in komplexe Abläufe einzubinden. Dadurch lassen sich Graphdaten, einschließlich der Daten aus Data Lakes von Anwendern flexibler verarbeiten. Cypher für Apache Spark ist die erste Anwendung von Cyper, in der man als Abfrageergebnis sowohl Datentabellen, als auch Graphen erhält."
Darüber hinaus bietet Cypher für Apache Spark neue Funktionen für multiple Graphen und modulare Abfragen, die in der Zusammenarbeit mit der Anfang 2017 gegründeten openCypher Implementers Group entstanden sind. Das openCyper-Projekt bietet die Möglichkeit, in einer sehr frühen Phase an der Open Source Entwicklung von Cypher for Apache Spark unter der Apache 2.0 Lizenz mitzuwirken.
"Datenmengen nehmen überall mit rasender Geschwindigkeit zu und erreichen ein noch nie dagewesenes Volumen. Die Herausforderung, diese unterschiedlich strukturierten Datenmengen zu traversieren, einen Mehrwert aus ihnen zu schöpfen und Zusammenhänge offenzulegen, ist enorm", Stephen O"Grady, Analyst und Mitgründer von RedMonk. "Neo4j und die Graph-Abfragesprache Cypher entwickeln sich immer mehr zu DER Lösung für eben solche Aufgaben."
Neo4j ist der führende Graph-Plattform Anbieter und arbeitet kontinuierlich daran, Nutzern Graphtechnologie näher zu bringen. Neo4j unterstützt das 2015 gegründete Open Source Projekt openCypher. Absicht ist es, Graphdatenbanken in Zusammenarbeit mit der Open Source Community generell weiter zu etablieren und die Weiterentwicklung von Cypher zu einem Gemeinschaftsprojekt zu machen, das redundante Entwicklungsarbeit minimiert. Zur openCypher-Implementierungsgruppe gehören mehr als 20 Unternehmen, Organisationen und Hochschulen. Dieses Team trifft sich regelmäßig zu öffentlichen Gesprächen und diskutiert dabei die Weiterentwicklung von Cypher.
Mehr Informationen:
Neo4j Website
openCypher
Über Neo4j - DIE Plattform für vernetzte Daten
Neo4j ist eine hoch skalierbare, native Graphdatenbank, die vernetzte Daten effizient verarbeitet und in vollem Umfang nutzbar macht. Die Graphdatenbank unterstützt Unternehmen bei der Entwicklung intelligenter Anwendungen, um Herausforderungen von Heute erfolgreich zu meistern - von Machine Learning und künstlicher Intelligenz über Betrugserkennung und Echtzeit-Empfehlungen bis zu Stammdatenmanagement. Mit mehr als drei Millionen Downloads, der größten Community an Graph-Enthusiasten und Tausenden von graphbasierten Anwendungen in der Entwicklung, ist Neo4j DIE Plattform für vernetztet Daten.
Internationale Branchengrößen wie Walmart, eBay, UBS, Cisco, HP, adidas Group oder Lufthansa und Startups wie Medium, Musimap oder Glowbl nutzen Neo4j, um erfolgsentscheidenden Nutzen aus ihren Datenverbindungen zu ziehen.
Neo4j ist ein privat geführtes Unternehmen, das von Eight Roads Ventures (Beteiligungsgesellschaft von Fidelity International Limited), Sunstone Capital, Conor Venture Partners, Creandum, Dawn Capital und Greenbridge Investment Partners finanziert wird. Neo4j hat seinen Firmensitz in San Mateo, Kalifornien, und führt darüber hinaus Standorte in Deutschland, UK und Schweden. Weitere Informationen unter Neo4j.com und (at)Neo4j.
Lucy Turpin Communications
Birgit Fuchs-Laine
Prinzregentenstraße 89
81675 München
neo4j(at)lucyturpin.com
089 41 77 61 13
http://www.lucyturpin.de