view · edit · sidebar · attach · print · history

InfoCodex Enterprise Search with Content Analysis, The Best Knowledge-Manager In Town. - (:addThis username="myUsername" btn="sm-share":)

Einleitung

Was macht InfoCodex besser als die Konkurrenz? InfoCodex analysiert den Inhalt Ihrer Dokumente und legt dann eine einheitliche Sprache (Taxonomie) darüber. Mit InfoCodex können Sie sprachübergreifend suchen, d.h. 'War', Englisch = 'Krieg' wird von 'war', Deutsche Vergangenheit von 'ist' unterschieden. Ein weiteres Beispiel ist; 'die', Englisch = 'Sterben' und Deutsch = 'die' als Artikel (z.B. die Milch). So gibts 2.7 Mio Einträge in der linguistischen Datenbank von InfoCodex, welche eine sprachübergreifende Suche ermöglicht. Neben der sprachübergreifenden Suche ist auch die Synonym- und Ähnlichkeitssuche möglich (z.B. bei 'Führerausweis' wird auch nach 'Führerschein' gesucht).

Es geht darum, einerseits den Gesamtinhalt einer Kollektion und anderseits jedes einzelne Dokument _robotermässig_ zu analysieren und zu kategorisieren.

 Inhaltsverzeichnis:
 1.Worum geht es beim Wissensmanagement
 2.Mehrwerte, die mit Wissensmanagement erzielbar sind
 3.Evaluationsergebnis
 4.Alleinstellungsmerkmale (USPs) von InfoCodex
 5.Zugriffsschutz und Compliance
 6.Weitere Stärken von InfoCodex
 7.Referenzen
 8.Bemerkungen zu den Werbetexten von Konkurrenzfirmen
 9.FAQ InfoCodex
 10.InfoCodexVorgehen

Worum geht es beim Wissensmanagement?

  • Übersicht über das vorhandene Wissen gewinnen -> Nur wer die Übersicht hat, kann gezielt handeln.
  • Informationsquellen systematisch erschliessen -> gezielte Informationsrecherchen.
  • Dokumente kategorisieren -> Basis für jedes Responsemanagement.
  • Gewährleistung eines kontrollierten Wissenstransfers -> Früher erarbeitetes Wissen wieder verwenden; Wissen austauschen (mit internen und externen Stellen, siehe auch: InfoCodex-Flyer, Seite 1).

Daraus ergibt sich u.a.: Ein Wissensmanagement-Instrument muss den thematischen Inhalt von Dokumenten erkennen und die Dokumente entsprechend klassieren können (wenn möglich auch sprachübergreifend); mit einer reinen Suchmaschine sind die Probleme nicht gelöst.

Mehrwerte, die mit Wissensmanagement erzielbar sind...

  • Zeitersparnis -> Entlastung von Routinearbeit bei der Informationsbeschaffung sowie bei der Bearbeitung von Dokumenten.
  • Vorhandenes Wissen ausschöpfen -> Vermeidung kostspieliger Neuentwicklungen (von Produkten, Verträgen, Antworten an Kunden etc).
  • Fundierte Wissensbasis -> Qualitätssteigerung bei der Entscheidungsfindung; Früherkennung von Chancen und Risiken.
  • Zeitgewinn -> Kürzere Reaktionszeiten durch Responsemanagement, z.B. beim Beantworten von Kundenanfragen/Kundenreklamationen (siehe auch: InfoCodex-Flyer, Seite 4).

"Etwa 85% aller Unternehmensdaten schwirren unstrukturiert ausserhalb von Datenbanken herum... .Etwa 1/3 ihrer Zeit verschwenden folglich Angestellte damit, relevante Informationen in der immer grösser werdenden Datenflut zu suchen" (zitiert von Nelson Mattos, IBM's Vice President of Information Integration, Aug. 2005).

Evaluationsergebnis

In der umfassenden Evaluation von Wissensmanagement-Tools, welche durch die Agroscope - finanziert durch das Informatikstrategieorgan Bund (ISB) der schweizerischen Bundesverwaltung - durchgeführt wurde, haben InfoCodex und die Konkurrenz die Finalrunde erreicht (den Zuschlag hat schliesslich InfoCodex erhalten).

Alleinstellungsmerkmale (USPs) von InfoCodex

InfoCodex ist das einzige System, das über eine sprachübergreifende linguistische Datenbank verfügt, deren Einträge systematisch mit einem universellen Taxonomiebaum verknüpft sind. Das Verfahren zur Extraktion der Inhaltsschwergewichte und der Projektion auf einen optimalen Inhaltsraum zwecks Kategorisierung durch selbstorganisierende Neuronale Netze ist patentiert (CH, EU, USA). Patentinhaber ist die Swiss Re in einer speziellen Partnerschaft mit InfoCodex. Daraus ergeben sich:

Rasche Einsatzbereitschaft

Analyse und Kategorisierung der Dokumente ohne menschliche Intervention (d.h. InfoCodex ordnet die Dokumente selbständig in ein sachlogisch gegliedertes Büchergestell ein). Bei anderen Technologien (z.B. bei der Konkurrenz verwendeten "Pattern Recognition") braucht es in jedem neuen Vorhaben jeweils ein aufwändiges Trainieren der Kategorisierung.

Erweiterte Suchmöglichkeiten

Neben der üblichen exakten Suche (wie bei der bekannten Konkurrenz etc.) stehen auch die sprachübergreifende Synonymsuche (mit Fahrrad werden auch Velo, Drahtesel, push bike, bicyclette etc. gefunden) und die Ähnlichkeitssuche (finde Dokumente, die einem gegebenen Dokument möglichst ähnlich sind; Kernproblem in der Patentrecherche) zur Verfügung.

Clustering nach Themen

Einerseits vermittelt InfoCodex mit seiner Informations-Landkarte einen raschen Überblick über Inhalt und Struktur einer Dokumenten-Kollektion. Anderseits können beim Retrieval im Falle von grossen Trefferlisten die Dokumente in themenspezifische Clusters unterteilt werden (Heat-Map bzw. Clustering). Dies kann ein gezieltes Recherchieren entscheidend beschleunigen. Beispiel: Wenn man sich für Tiere interessiert und nach "Tiger" sucht, wird man den Bereich "Sport" besser weglassen.

Automatische Bildung von Abstracts (Kurzfassungen der Dokumente) -> effiziente Beurteilung von Suchresultaten

Es gibt zwar spezielle Software für die Generierung von Abstracts. Bei den anderen Wissensmanagement-Tools steht unseres Wissens jedoch keine Abstract-Bildung zur Verfügung.

Identifikation von Dokumentenfamilien

Erkennen von fast gleichen Dokumenten (z.B. leicht revidierte Versionen des gleichen Dokuments) und Zusammenfassung in Dokumentenfamilien. Dies ergibt einerseits kürzere Trefferlisten; andererseits ist dies ein Hilfsmittel bei Aufräumungsvorhaben.

Zugriffsschutz und Compliance

Anbindung von InfoCodex an eine zentrale Benutzerverwaltung mit der LDAP-Schnittstelle; volle Respektierung der "File-System-Security"; dazu IC-Domänenkonzept für höchste Sicherheitsan­sprüche. Die Sicherheitsaspekte wurden bei der Agroscope-Evaluation einem harten Test unterzogen (hier weisen diverse Systeme grosse Schwachstellen auf).

Weitere Stärken von InfoCodex#Weitere_Stärken_von_InfoCodex

E-Mails einschliesslich Attachments

Im Gegensatz zu anderen Systemen analysiert InfoCodex nicht nur den "E-Mail-Body", sondern auch die Attachments. Ausserdem zeigt InfoCodex beim Sichten die Original-Dokumente und deren Attachments an.

In der Praxis liegt ein grosser Teil der Information in den Attachments (und nicht im E-Mail-Text).

Erprobte Spider-Agents

Die gebäuchlichen File-Formate (PDF, Word, PPT, HTML, XML, PS, RTF, Excel, E-Mails + Attachments, TXT, TIF, ZIP, GZIP etc.) werden standardmässig unterstützt.

Automatische Verschlagwortung von Dokumenten in hoher Qualität

Einfachheit beim Anlegen neuer Kollektionen

Im Prinzip kann jeder Benutzer praktisch ohne Schulung eigene Kollektionen/Wissensgebiete anlegen. Routinemässig durchzuführende Recherchen können problemlos dem Job-Scheduler aufgegeben werden.

Erweiterte Internet-Recherchen

Erweiterungen durch Beizug von Synonymen aus der InfoCodex-Datenbank; leichtes Aufsetzen von periodisch wiederkehrenden Recherchen (siehe auch: InfoCodex-Flyer, Seite 4)

Objektives Mass für das Ranking

Ordnen von Dokumenten nach Ähnlichkeit mit einem Abfragetext aufgrund des fundierten Ähn­lichkeitsmasses, welches sich aus der patentierten InfoCodex-Technologie ergibt.

Minimale Einsatzvorbereitung / keine organisatorischen Umstellungen

In Standardfällen kann InfoCodex nach wenigen Stunden produktiv genutzt werden. Es sind keine organisatorischen Anpassungen nötig. InfoCodex passt sich an die bestehende Ordnung an und legt keine Kopien der Dokumente ab (es liest und analysiert die Dokumente und behält lediglich den Link zum Originaldokument). Bei der Konkurrenz kann die Einsatzvorbereitung mehrere Monate dauern.

Referenzen

InfoCodex ist bei mehreren erstklassigen Kunden installiert, z.B.

  • Alle 5 Landwirtschaftlichen Forschungsanstalten der Schweiz (Agroscope)
  • Schweizerische Normen-Vereinigung
  • Swiss Re (weltgrösster Rückversicherungskonzern)
  • Siemens Building Technologies
  • SOGEI (IT-Dienstleister des italienischen Wirtschaftsministeriums)
  • i-Expo Preis Paris 2006

Bemerkungen zu den Werbetexten von Konkurrenzfirmen

Beim Lesen von Produktbeschreibungen der Konkurrenz erhält man vielfach den Eindruck, dass eine weitgehende Mehrsprachigkeit abgedeckt ist (z.B. Unterstützung von 67 Sprachen oder sprachun­abhängig). Unsere genaueren und aufwändigen Abklärungen haben immer wieder zum selben Ergebnis geführt: Unter Mehrsprachigkeit wird lediglich ein grobes Verfahren zur Abschätzung der Sprach­zugehörigkeit verstanden. Eine echte sprachübergreifende Methode mit Sinnerkennung (Taxonomie) konnte bei keinem Konkurrenzprodukt gefunden werden.

Links

====


Frage 1: "Werden PDF Files hinter PDF Links auf einer Website auch indexiert?"

Die Antwort ist JA.

PDF-Files werden durch verschiedene Software generiert (z.B. aus Word). Je nach erstellender Software bestehen Unterschiede im internen File-Aufbau. Dies führt dazu, dass die Konversion in TXT-Files nicht immer funktioniert (viele PDF-Files, die man im Internet sieht, werden beispielssweise durch die grossen Suchmaschinen nicht indexiert).

Das in InfoCodex realisierte Vorgehen sieht wie folgt aus:

  • Erster Versuch mit "pdftotext": Open-Source-Software; durch uns leicht modifiziert. Beste Resultate, wenn es funktioniert.
  • Zweiter Versuch (wenn pdftotext Gargabe produziert): Verwendung des iFilters von Adobe (Resulte brauchbar, aber mit kleineren Fehlern bei Zeilenumbrüchen behaftet). DLL Beilage Verlangen.
  • Wenn alles versagt: Das PDF-File wird als reines Image-File betrachtet, und zur Indexierung wird ersatzweise der Pfadname genommen.

_Ausnahme_: Wenn die OCR-Software Option aktiviert ist, wird das PDF-File durch den OCR-Interpreter geschickt und das Resultat wird mit pdftotext bzw. dem iFilter von Adobe konvertiert. Wir verwenden OmniPage als OCR-Interpreter, aber diese Komponente ist zurzeit noch nicht fest eingebaut (ist bei uns in der Testphase).

_Hinweis_: Viele PDF-Files sind reine Photokopien und müssen zwecks Indexierung durch den OCR-Interpreter geschickt werden.

Frage 2: "Stellt InfoCodex Rechnung pro indexiertes Dokument?"

Nein! InfoCodex verfolgt die User-Pro-Jahr-Fee Philosophie. Sie erhalten eine CD mit der Software. Die Anzahl User, welche mit der Software erstellt werden können, ist in die Software reinkompilliert. Sie können mit InfoCodex also beliebig viele Dokumente indexieren, soviele wie Sie CPU-Power zur Verfügung stellen wollen. Sie können InfoCodex also auch auf mehreren Server installieren.

Frage 3: "Was ist das Vorgehen von InfoCodex nach dem Indexieren der Dokumente?"

view · edit · sidebar · attach · print · history
Page last modified on January 29, 2010, at 03:34 PM