Informatica HParser ermöglicht unternehmenstaugliches Parsing von Big Data Logs, Dokumenten und Branchenstandards für Hadoop
(firmenpresse) - Frankfurt, Redwood City (Kalifornien/USA), 8. November 2011 – Informatica (NASDAQ: INFA), die weltweite Nummer eins als führender unabhängiger Anbieter von Software für die unternehmensweite Datenintegration, hat die unmittelbare Verfügbarkeit des Informatica HParser angekündigt, der ersten Daten-Parsing-Transformationslösung für Hadoop-Umgebungen. Der Informatica HParser läuft auf fast jeder Aufteilung von Apache Hadoop und nutzt dabei die Parallelität des MapReduce Framework, um unstrukturierte komplexe Daten, wie z.B. Weblogs, Social Media-Daten, Rufdetailaufzeichnungen und andere Datenformate in ein strukturiertes oder halbstrukturiertes Format in Hadoop umzuwandeln. Sobald die Daten in ein strukturierteres Format umgewandelt sind, können sie rascher genutzt und validiert werden, um geschäftliche Erkenntnisse voranzutreiben und betriebliche Abläufe zu verbessern.
Der in einer kostenlosen Community-Version und kommerziellen Versionen verfügbare Informatica HParser bietet Unternehmen die Lösung, die sie benötigen, um den Mehrwert komplexer, unstrukturierter Daten zu nutzen. Diese starke Daten-Parsing-Fähigkeit in Hadoop ermöglicht es Unternehmen, ein neues Maß an Produktivität, Effizienz und Skalierbarkeit zu erreichen. Unternehmen können ihre bestehenden IT-Investitionen durch den Einsatz des Informatica HParser als Standard für das Daten-Parsing in Hadoop umgehend erhöhen. Durch den Einsatz des Informatica HParser profitieren die Kunden von einer maschinen-basierten Lösung, welche ein extrem breites Spektrum an Datenformaten abdeckt und den Analyseprozess durch Eliminierung von Risiken und Kosten der einmaligen benutzerdefinierten Parsing-Scripts deutlich vereinfacht und beschleunigt.
Einzigartige Vorteile des Informatica HParser
Zu den Vorteilen, die Informatica HParser bietet, gehören:
•Rasche, visuelle Entwicklung – Das visuelle Integrated Development Environment (IDE) des HParsers für die Erstellung und Bewahrung von Umwandlungen beschleunigt die Entwicklung und fördert die Produktivität der Entwickler. Außerdem wandelt HParser tiefe Hierarchie und Beziehungen in ein flacheres, leichter verwendbares Format und ermöglicht die Validierung der Geschäftsregeln.
•Einzelne Maschine deckt ein breites Spektrum an Datenformaten ab – die betriebsbereiten Umwandlungsblöcke oder Bibliotheken des HParsers decken ein breites Spektrum an allgemeinen und branchenspezifischen Datenformaten ab, darunter Support für XML und JSON; SWIFT, X12, NACHA für die Finanzbranche; HL7 und HIPAA für die Gesundheitsbranche; ASN.1 für die Telekommunikationsbranche; sowie Marktdaten.
•Support für gerätegenerierte Logs –HParser vereinfacht das Parsing komplexer geräte- oder maschinengenerierter Inhalte, einschließlich firmeneigener Logdateien wie Apache Weblogs und Omniture Logs.
•Nutzung der Parallelität in MapReduce –HParser liefert eine optimierte Parsing-Performance für große Dateien mit komplexen Daten, indem er nativ in MapReduce läuft und seine Parallelität vollständig nutzt.
•Nutzung von Best Practices über Großprojekte hinweg – Mit HParser können Entwickler eine Abstraktionsschicht zwischen der Applikationslogik in MapReduce und Datenquellen schaffen. Hierdurch können Projekte leicht skaliert werden, indem die Applikationslogik einmal geschrieben und dann bei mehreren Datenquellen angewandt wird. Durch Nutzung derselben IDE können die Design-Artefakte auf den Rest des Unternehmens – außerhalb der Hadoop-Projekte – angewandt werden.
Zitate
•„Bis 2014 werden die Unternehmen, die Analysetechniken zur Unterstützung neuer, komplexer Datentypen und großer Datenvolumen in der Analytik angewendet haben, auf dem Markt um mehr als 20 Prozent besser abschneiden als ihre Konkurrenten, und zwar gemäß fast jeder akzeptierten, standardisierten Leistungsrechnungsmetrik“, sagt Merv Adrian, Research Vice President bei Gartner1. „Die Fähigkeit, verschiedene unstrukturierte und multi-strukturierte Daten mit tiefen Hierarchien in ein Format zu verwandeln, das leicht analysiert und verarbeitet werden kann, ist die Grundlage für die Entwicklung einer logischen, konsistenten Informationsinfrastruktur, die auch auf Big Data, einschließlich Hadoop, angewandt werden kann. Für ein datenzentriertes Unternehmen ist es elementar wichtig, nach allgemeinen Wegen zur Vereinheitlichung und Sinnfilterung aus allen möglichen Inhalten unter Verwendung von Standards wie XML und JSON zu suchen, damit diese im gesamten Unternehmen ausgetauscht werden können.“
•„Die Nachfrage auf dem Markt nach der Nutzung des vollen Potenzials von Big Data für den Geschäftswert ist hoch“, sagt Tom Kersnick, Director des Big Data Center of Excellence (CoE) für den Bereich Data Warehousing, Business Intelligence und Performance Management Practice bei Cognizant. „Deshalb hat Cognizant das Big Data CoE eingerichtet, in dem Hadoop einer unserer strategischen Wachstumsmotoren ist. Im Rahmen unseres Beta-Engagements mit Informatica haben wir eine Reihe von Anwendungsfällen geprüft, und der HParser hat gezeigt, wie komplexe, hierarchische Dateien durch paralleles Parsing in eine einfach zu bedienende, grafische Nutzerschnittstelle überführt werden können. Bei der Erweiterung unserer Kompetenz für Big Data ist diese Art des skalierbaren und effizienten Ansatzes beim Daten-Parsing in Hadoop ein entscheidender Faktor für den Aufbau von Kompetenzen und die Verbesserung des Service für unsere rasch wachsende gemeinsame Kundenbasis.“
•„Informatica HParser, das neueste Produkt in der Familie von Informatica B2B Data Exchange und der Informatica Platform, ist die Antwort auf die steigende Nachfrage nach der Erzielung von Geschäftswert aus großen Volumen unstrukturierter, komplexer Daten“, so Juan Carlos Soto, Senior Vice President und General Manager von B2B Data Exchange and Cloud Data Integration bei Informatica. „Der HParser kombiniert die aktuellste Innovation von Informatica, die für Hadoop optimiert wurde, mit unserer unerreichten Erfahrung beim Parsing unstrukturierter Daten und der Handhabung von branchenüblichen Formaten. Der Informatica HParser ist ein bedeutender Meilenstein auf unserem Weg, Unternehmen dabei zu unterstützen, Big Data zu nutzen, und eine weitere Lösung von Informatica, mit der Organisationen ihre Renditen aus den Daten maximieren können.“
Informatica HParser – Versionen und Verfügbarkeit
Informatica HParser ist ab sofort in drei Versionen erhältlich:
•HParser für Logs, Omniture, XML und JSON (Community-Version) – Kostenlos erhältlich, mit Support von Informatica und Add-on Features, die zum Kauf zur Verfügung stehen.
•HParser für Branchenstandards und Dokumente (Kommerzielle Versionen)
Beide kommerzielle Versionen des Informatica HParser können 30 Tage lang kostenlos getestet werden.
Ãœber Informatica
Informatica (NASDAQ: INFA) ist der weltweit führende unabhängige Anbieter von Datenintegrations-Software. Unternehmen auf der ganzen Welt verlassen sich auf Informatica, um mit aktuellen, relevanten und zuverlässigen Daten für alle wichtigen Geschäftsanforderungen einen entscheidenden Wettbewerbsvorteil zu erhalten. Weltweit vertrauen mehr als 4.500 Unternehmen bei Big Data-, Datenintegrations- und Datenqualitätsprojekten auf Informatica, um auf ihre Datensätze in der Internet-Cloud und am Firmenstandort zuzugreifen, sie zu integrieren und ihre Zuverlässigkeit sicherzustellen. Weitere Informationen erhalten Sie unter +1 650 385 5000 (1-800-653-3871 in den U.S.) oder unter www.informatica.com.
Informatica auch auf: http://www.facebook.com/InformaticaCorporation, http://www.linkedin.com/company/informatica und http://twitter.com/InformaticaCorp
Informatica GmbH
Daniela Dalkner
Head of Marketing Central Europe
Lyoner Strasse 15
60528 Frankfurt am Main
Tel.: +49 (0)69 92 88 09 - 150
Mobil: +49 (0) 171 764 43 72
ddalkner(at)informatica.com
http://www.informatica.com/de
Informatica Software Ltd.
Kristen Miller
Senior PR and AR Manager EMEA
Edisonbaan 14a
NL - 3439 MN Nieuwegein
Tel.: +31 (0) 30 – 6086725
Mobil: +31 (0) 6-53 75 2239
kmiller(at)informatica.com
http://www.informatica.com/
OnPR GmbH
Simon Jones
Managing Director
Grasserstr. 10
80339 München
Tel./Fax: +49 (0) 89 309051610
Mobil: +49 1522 280 1626
simonj(at)onpr.com
http://www.onpr.com