Month: April 2017

Na, wer ist ein guter Junge? – DeepDoggo

DeepDoggo beantwortet die Frage: “Na, wer ist ein guter Junge?” mit Deep Learning. Ben Lengerich von der Carnegie Mellon University hat DeepDoggo gebaut und ein Paper dazu veröffentlicht.

deepdoggo2Er nutzt das Inception-v3 Modell [Szegedy et al., 2016]. Dabei wurde der Output vom letzten Pooling-Layer benutzt, um zwischen good dog und bad dog zu separieren.

DafĂŒr wurde ein Datenset von Google benutzt. Nach einer Google Suche wurden 360 Bilder fĂŒr bad dogs und 585 Bilder fĂŒr good dogs benutzt.

Mit seinem Modell erreichte er eine Accuracy von 73.0%. Damit ist er 11.1% besser als eine Baseline, bei der jeder Hund als guter Junge klassifiziert wird. Bei dieser Form von Baseline handelt es sich um einen ZeroR-Klassifikator, der sich in allen FĂ€llen fĂŒr die Klasse entscheidet, die am meisten Samples im Training-Set bereitstellt.

Lengerich sieht die Anwendung fĂŒr DeepDoggo vor allem im Hundetraining, argumentiert das aber eher scherzhaft. Im Allgemeinen ist die Anwendung DeepDoggo scherzhafter Natur und das bereitgestellte Paper dazu auch.




Hier gehts zum Paper von Ben Lengerich.

Referenzen

[Szegedy et al., 2016] Szegedy, Christian, Vanhoucke, Vincent, Ioffe, Sergey, Shlens, Jon, and Wojna, Zbigniew. Rethinking the inception architecture for computer vision. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 2818–2826, 2016.

 

Ist das der neue Assistent in eurem Auto? – Holger Weis von German Autolabs

German Autolabs ist aktuell mit dem proaktiven Assistenten Chris im Crowdfunding auf Kickstarter unterwegs. Bereits vorzeitig haben sie dabei ihr Fundingziel erreicht. Wir hatten den GeschĂ€ftsfĂŒhrer von German Autolabs im Interview.

Bei vielen GrĂŒndern entsteht eine Idee aus einem praktischen Problem heraus. Ist euer proaktiver Assistent Chris auch aus einem Problem heraus entstanden, dass ihr persönlich hattet?

Absolut, so war das bei uns auch. Ich war auf der Autobahn unterwegs irgendwo bei Bonn und mein Smartphone hat stĂ€ndig wegen neuer Nachrichten vibriert, die ich aber bei Tempo 140 nicht beantworten konnte. Ich war genervt und durch das stĂ€ndige Gebrumme auch abgelenkt. Beruflich habe ich ja mit gate5 / Nokia und Aupeo / Panasonic jahrelang im Bereich Connected Car gearbeitet. Ich dachte, da muss es eine Lösung geben. Gab es aber nicht – zumindest nicht fĂŒr den Großteil der Fahrzeuge, die auf unseren Straßen fahren, denn die sind 9,3 Jahre alt und alles andere als “Connected”. Daher nutzen Autofahrer beim Fahren ihr Smartphone, obwohl es illegal und gefĂ€hrlich ist.

Holger Weiss. CEO von German Auto Labs GAL GmbH.

Holger G. Weiss. CEO von German Auto Labs GAL GmbH.

Auf welche Funktion von Chris seid ihr besonders stolz? Was könnt ihr zum aktuellen Entwicklungsstand des Produktes sagen?

Besonders stolz sind wir darauf, dass Chris als Sprachassistent fĂŒr Autofahrer nicht nur proaktiv, intelligent und unterhaltsam sein wird, sondern auch noch sehr gut aussieht. Wir haben sehr lange auf der Straße, etwa an Tankstellen und bei Reifenshops, mit potenziellen Kunden gesprochen und Chris funktionell und design-technisch immer wieder verbessert, – hier beschreiben wird den Prozess im Detail. Vom Entwicklungsstand her ist Chris nun fertig designed. Wir haben alle relevanten Hardware-Komponenten identifiziert, testen fleißig und sind dabei alles ins GehĂ€use zu bringen. Unser Entwicklungsteam arbeitet mit Hochdruck an der KĂŒnstlichen Intelligenz und den entsprechenden Apps fĂŒr iOS und Android.

Mit Chris habt ihr ein mĂ€nnliches Assistenzsystem geschaffen. Viele Kollegen von Chris sind ja bekanntlich weiblich. Was waren die GrĂŒnde dafĂŒr, mit Chris einen mĂ€nnlichen Assistenten zu bauen?

Die Assoziation gibt es interessanterweise nur in Deutschland. Denn international ist der Name Chris geschlechtsneutral, gerade im angloamerikanischen Sprachraum ist Chris als Kurzform von Frauennamen ganz normal. Und in der Kampagne auf Kickstarter hört man eine weibliche Stimme. Mit der wollen wir auch starten, denken aber darĂŒber nach, spĂ€ter weitere Stimmen anzubieten.

In eurem Kampagnenvideo habt ihr davon gesprochen, dass die Kommunikation via Gesten und Voice am wenigstens ablenkt. Könnt ihr uns etwas zur technischen Realisierung der Gestenerkennung verraten?

Wir nutzen einen Infrarot-Gestensensor, der im GerÀt verbaut ist. Bei den Gesten ist es uns sehr wichtig, dass sie ganz einfach sind und damit den Fahrer nicht ablenken. Das entwickelte Gestenset richtet sich genau danach: rechts, links, oben, unten und nah, fern. Hier muss niemand etwas einstudieren, die Bewegungen sind schon gelernt, wie man im im offiziellen Kickstarter-Video ganz gut sieht.

FĂŒr General Purpose Assistenzsysteme wie Siri, Cortana, Alexa und co. ist der Datenschutz in Deutschland eine schwierige Sache, da die Kommunikation auf Servern in den U.S.A. gespeichert wird. Wie funktioniert die Kommunikation bei Chris? Wo speichert ihr die Kommunikationsdaten und ist Chris auch in der Lage, bestimmte Sachen bezĂŒglich seiner Kommunikation zu lernen?

Wir speichern die Kommunikationsdaten gar nicht, sondern senden diese an einen Dienst, der die Sprachdaten in Text ĂŒbersetzt – und den Text reichen wir an die Dienstanbieter wie etwa WhatsApp oder das E-Mail-Konto durch. Wir speichern nur Daten, um Chris möglichst optimiert und personalisiert zur VerfĂŒgung stellen zu können: Benutzername und Passwort zur Authentifizierung, Nutzereinstellungen wie “Zuhause”, “Arbeit” oder “Lieblingsziele”, Kontakte, Nutzungshistorie. Diese Informationen sind verschlĂŒsselt gespeichert.  

Chris-Still-What-You-Get-72dpi-Lowres

Chris – Der proaktive Assistent fĂŒr das Auto.

Welche Challenges habt ihr noch vor euch? Was ist eure große Zukunftsvision mit Chris?

Wir befinden uns mit Chris in einer Produktkategorie, die ja gerade erst entsteht. FĂŒr den Bereich des Auto sind es sogar wir, die diese Kategorie entwickeln. Das bedeutet, dass wir noch viel lernen und verstehen mĂŒssen – und so manche Herausforderungen werden wir entlang des Weges erkennen. Wir sind aber zuversichtlich, dass wir diese mit unserem Team, das seit Jahren im Tech- und Automotivebereich arbeitet, lösen können. ZunĂ€chst geht es darum, das Produkt kontinuierlich zu verbessern. Mehr Sprache, mehr Services und besseren Bedienkomfort. DarĂŒber hinaus wird es sicher mit der Zeit zusĂ€tzliche Funktionen in der Hardware geben. Alles werden wir hier aber nicht verraten…

Chris-Still-Front-View-Music-72dpi-Lowres

Chris beherrscht neben Spotify und WhatsApp noch weitere der meistgenutzten Apps.

Es gibt einige junge Teams und Startups, die ebenfalls im Bereich KĂŒnstliche Intelligenz / Machine Learning unterwegs sind. Gibt es ein Learning, dass ihr diesen Teams mit auf den Weg geben könnt?

Wichtig ist, dass man nicht immer alles selber machen muss. Es gibt ja bei der Spracherkennung und auch der Sprachsynthese zum Beispiel etablierte und sehr fĂ€hige Anbieter, die wir auch nutzen. Aber wenn man etwa das Natural Language Processing als Ganzes betrachtet, muss man als Start-up die Kerntechnologien wie etwa das Dialogmanagement, also das Verstehen von Sprache in ihren Nuancen, selber in der Hand haben – das sind dann letztlich die Werte des Unternehmens!


Gibt es noch etwas, dass ihr unbedingt loswerden wollt?

Der Begriff KĂŒnstliche Intelligenz löst bei vielen Menschen oft Unbehagen aus. Darauf mĂŒssen wir RĂŒcksicht nehmen. Uns ist es wichtig, dass gerade wir als Start-up in diesem Bereich auch transparent kommunizieren, zumal es um Anwendungen fĂŒr Endverbraucher geht. Datensicherheit und -schutz haben oberste PrioritĂ€t. Zudem soll der Mensch immer die Kontrolle ĂŒber die Maschine behalten. Chris kann ein angenehmer Beifahrer sein, der mitdenkt, dem Fahrer Aufgaben abnimmt und ihn unterhĂ€lt. Nicht mehr, aber auch nicht weniger.

Danke fĂŒr die spannenden Einblicke in eure Arbeit Holger!