Dr. Tim Lammarsch
Technologieberatung und Softwareentwicklung
Deutsch
English

Redaktionelle Artikel – Sach- und Fachthemen der Informationtechnologie

6. Dezember 2017: Liegt die Zukunft der Datenauswertung in der Künstlichen Intelligenz?

Künstliche Intelligenz ist in aller Munde, nicht zuletzt auf dem dem 15. Österreichischen IT- & Beratertag. Während faszinierende Präsentationen die Möglichkeiten der neuen Technologien zeigten, kamen auch Kritiker zu Wort, die vor Gefahren warnten.

Um die drohenden Gefahren zu verstehen, und die neuen Möglichkeiten sicher nutzen zu können, bedarf es einiger Grundlagen. In aktuellen Erfolgsgeschichten aus den Medien wie z.B. dem Erfolg des Systems AlphaGo ist vor allem der Bereich Deep Learning entscheidend für die neuen Möglichkeiten. Diese Technologie geht eigentlich auf Entwicklungen zurück, die schon 1986 begannen, aber erst in jüngerer Zeit wurde die Öffentlichkeit darauf aufmerksam.

Warum also der 30 Jahre dauerende Dornröschenschlaf? Es gibt verschiedene Gründe, die alle auf notwendigen Weiterentwicklungen zurückgehen, um die Methodik anwendbar in der Praxis zu machen. Ganz entscheidend war definitiv die rasante Entwicklung der Prozessorgeschwindigkeit in diesen 30 Jahren, denn Deep Learning benötigt ganz beachtliche Rechenkapazitäten.

Zu den erfolgreichen Anwendungen zählen momentan neben dem direkten Besiegen von Menschen in Denkspielen vor allem das Erkennen von Objekten auf Bilder und in Echtzeit-Videos, die Spracherekennung, sowie biomedizinische Anwendungen. Ebenfalls empfohlen wird Deep Learning seit einiger Zeit für Customer-Relationship-Management und personalisierte Werbung. Aufgrund der gegenwärtig nachwievor gegebenen Fehlentscheidungen, die auftreten können, würde ich ein derartiges System aber momentan noch nicht ohne Freigabe durch einen Menschen Kundenkontakte pflegen lassen. Ein Versuch von Microsoft, ein automatisiertes System auf Twitter als Werbung für die eigenen Bestrebungen in Künstlicher Intelligenz zu präsentieren endete in einem Desaster, als Nutzer dem System Antisemitismus und anderes „beibrachten”.

Ein wesentlicher Faktor, um solche Probleme zu vermeiden, ist natürlich, bis auf weiteres streng zu kontrollieren welche Daten von einem System zum Training verwendet werden, und welche Daten seine Entscheidungen nicht verändern sollen. Nicht möglich ist das natürlich für die zu klassifizierenden Eingaben. Wissenschaftlern ist es z.B. gelungen, mit für Menschen völlig sinnlosen Eingabebildern Fehlentscheidungen zu provozieren, die das System für zu 99,6% richtig hielt.

Lösen lässt sich dies nur, wenn Menschen verstehen, warum eine Künstliche Intelligenz eine bestimmte Entscheidung trifft. Im Feld Visual Analytics sind daher große Bestrebungen im Gange, um dazu einen Beitrag zu leisten, wie Publikationen der IEEE VIS 2017 zeigen. Momentan ist die Forschung leider noch voll und ganz damit ausgelastet, den Trainigsprozess zu unterstützen und Tools zu entwickeln, die sich direkt an Experten in Künstlicher Intelligenz richten. Anwender aus Industrie und Dienstleistungen werden wohl noch einige Jahre mit fertigen Systemen arbeiten müssen, die zwar unglaubliches leisten, aber immer noch einem gewissen Grad menschlicher Überwachung bedürfen.

Fazit: Künstliche Intelligenz wird langfristig die Entscheidungsprozesse in Firmen entscheidend verändern. In der momentanen Situation wäre es aber leichtsinnig, alleinige Entscheidungen dem Computer zu überlassen. Systeme, die Entscheidungen von Künstlicher Intelligenz transparent machen können, sind dringend gefragt, um den Übergang optimal gestalten zu können.

3. Juli 2017: Herausfoderungen und Chancen beim Erfassen von Kundendaten

Erfassung von Kundendaten gehört traditionell eigentlich zum „Guten Ton” für KMUs. Ein Wirt, der seine Stammkunden mit Handschlag begrüßt ist ebenso gern gelitten wie ein Finanzdienstleister, der sich beim Smalltalk mit den Kunden über ihre Familie unterhalten kann. Tatsächlich hat die Natur dem Menschen einen hochwertigen Gesichtserkennungsalgorithmus und eine hochintuitive Datenbank für persönliche Daten mitgegeben: das Gehirn.

Die Weiterentwicklung der IT zwingt Unternehmern nun zunehmend mehr als einen Spagat auf. Zum einen wird erwartet, diese Form des „Guten Tons” weiter zu betreiben und auch auf digitale Kommunikation zu übertragen, zum anderen sind viele Kunden auch hochsensibel geworden was ihre persönlichen Daten betrifft. Außerdem geben viele Anbieter von Informationssystemen vor, welche Daten zu erfassen sind – das hat in der Regel technische Gründe, allerdings sind diese in der Praxis meist nicht in Stein gemeißelt, sondern entstehen durch einen Mangel an Kommunikation zwischen Systembetreibern und Systemanbietern sowie durch zu geringes Interesse bei Entscheidern, diese Vorgaben flexibler zu gestalten. Oberflächlich erscheint es einfacher, die Daten einfach abzufragen, doch ist dies wirklich wahr?

Die Erfassung von Kundendaten in einem Informationssystem erfolgt gezielter als in einem typischen Gespräch unter Menschen, außerdem werden die Daten in der Regel langfristiger gespeichert. Was die Datenerfassung aber wirklich für Menschen unheimlich macht ist die Unklarheit darüber, was mit den Daten passiert. Tatsächlich können vor allem extrem große Datensammler wie Facebook oder Google zumindest in der Theorie tatsächlich einiges über ihre Kunden herausfinden, was diese eben nicht verraten möchten. Ein typisches KMU hingegen verfügt in der Regel nicht annährend über ausreichende Vergleichsdatenbestände. Erfassung von Kundendaten beschränkt sich dabei übrigens nicht nur auf das, was Kunden selbst in Formularen angeben – werden Kunden, z.B. über die weit verbreitete Cookie-Technologie „wiedererkannt”, so ist der Effekt im Grunde derselbe, als hätte sich der Chef das Gesicht des Kunden gemerkt.

Gerade die Cookie-Technologie ist auch ein Beispiel für das Bestreben der Politik, die Thematik zu regulieren. Leider ist das Ergebnis weder für die Unternehmen noch für die Kunden befriedigend. Unternehmen sind mehr oder weniger mit einem zusätzlichen technologischen Aufwand, dem sogenannten „Cookie-Banner” konfrontiert, für Kunden gibt es aber auch keine Möglichkeit dieser Nutzung der Technologie zu widersprechen.

Eine sinnvollere Herangehensweise für KMUs ist es, Kunden für alle Informationen, die erfasst werden, einen Grund zu erklären, der optimalerweise die Vorteile auf beiden Seiten hervorhebt. Beispielsweise kann ein Handwerksbetrieb oder Logistikdienstleister, der die Telefonnummer erfragt, Statusmeldungen per SMS für die Kunden anbieten. Oft ist es hilfreich, die Angabe von Daten nicht zwingend notwendig zu machen. Kunden, die ein Feld leer lassen, und dann am Absenden des Formulars gehindert werden, neigen dazu falsche Angaben zu machen. Diese führen zum sogenannten Effekt von „Dirty Data”. Unter Experten für Datenanalyse gelten dabei leere Felder als deutlich einfacher zu handhaben denn Felder mit bewusst fehlerhaften Angaben. Wenn Kunden bewusst ist, dass sie durch das leer lassen des Feldes für die Telefonnummer auf ihre Statusmeldungen verzichten, so sind sie oft deutlich eher bereit ihre Nummer korrekt anzugeben, als wenn man versucht, sie dazu zu zwingen.

Wie eingangs erwähnt, führen leere Felder oberflächlich gesehen zu technischen Problemen. Tatsächlich haben ältere Datenbanksysteme oft fixe Vorgaben, welche Daten notwendig sind, um Datensätze eindeutig zu trennen. In der Praxis ist es aber auch möglich, diese Identifikationsfaktoren flexibel zu gestalten und auf die Angaben zurückzugreifen, die Kunden freiwillig machen. Wenn es möglich ist, dass zwei unterschiedliche Kunden dabei dieselben Angaben gemacht haben, so handelt es sich zumeist sowieso um eine Ebene der Geschäftsprozesse, bei der eine eindeutige Kundenidentifikation keinen wirklich Mehrwert hat. Ein Beispiel hier wäre ein Dienstleister für Warenvergleiche, der eher das generelle Interesse an bestimmten Warengruppen analysiert als eine Einteilung in einzelne Kunden vorzunehmen.

Fazit: KMUs müssen das Interesse ihrer Kunden an indiviuellen Lösungen gegen das Interesse der Kunden am Schutz der Privatsphäre ausbalancieren. Mit modernen Informationssystemen ist es möglich, Kundendatensätze auf Basis partieller Angaben (mit leergelassenen Feldern) zuzulassen. Mehrwert bei den Leistungen ermutigt Kunden oft, freiwillig weitere Daten zur Verfügung zu stellen.

Zusatz vom 21. November 2017: Durch das finale Inkrafttreten der EU-Datenschutz-Grundverordnung am 25. Mai 2018 wird einiges was bisher und in diesem Artikel noch als „gute Vorgehensweise” betrachtet wird rechtlich verpflichtend – Details dazu werden hier in naher Zukunft folgen.