März 2017 – Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks Jun-Yan Zhu et al. Anhand von Generative Adversarial Networks (GANs) wird versucht, ein Bild in ein anderes Bild zu übersetzen und dabei lediglich einige Elemente zu verändern. Beispielsweise zeigen die Autoren, wie Äpfel in Orangen oder Pferde in Zebras transferiert wurden. Auch ein Gemälde von Monet konnte in ein photoreales Bild umgewandelt werden. [Zum Paper] August 2016 – Pixel Recurrent Neural Networks Aaron van den Oord et al. PixelRNN (Vorgänger PixelCNN) ist ein System, dass anhand eines Bildausschnitts den Rest des Bildes vorhersagen kann. Dieses Paper ging aus dem Google DeepMind Projekt hervor. Hierbei wurden besondere Formen von LSTMs (Long Short Term Memory) vorgestellt – nämlich Row LSTM und Diagoal BiLSTM. Diese können auf großen Datensets besser skalieren. [Zum Paper] März 2016 – Semantic Style Transfer and Turning Two-Bit Doodles into Fine Artwork Alex J. Champandard. Eine einfache Zeichtung aus dem Paint in ein Kunstwerk überführen? Davon handelt diese Veröffentlichung. Am Beispiel vom Stil von Van Gogh wird gezeigt, wie man semantische Informationen nutzen kann, um den Style Transfer, also das Anwenden des Kunst-Stils des Künstlers auf das Bild, durchzuführen. [Zum Paper] Januar 2016 – Combining Markov Random Fields and Convolutional Neural Networks for Image Synthesis
Chuan Li und Michael Wand. Die Autoren zeigen das ihre Methode mit MRF (Markov Random Fields) und dCNNs besser funktioniert, als der State-of-the-Art (Jan 2016). Ihre Methoden zur Image Creation bzw. photorealistischen Bildsynthese benutzen dabei verschiedene Mechanismen, die im generierten Bild keine unschönen und unnatürlichen Artefakte zulassen. [Zum Paper]
Juni 2015 – Deep Visual-Semantic Alignments for Generating Image Descriptions Andrej Karpathy und Li Fei-Fei. In diesem Paper wird gezeigt, wie man für Bilder eine Beschreibung generieren kann. Das funktioniert regionsbasiert und besteht aus mehreren Subsystemen. Es wurde ein Datenset mit Bildern und dazugehörenden Beschreibungen benutzt. Dieses Set wurde in eine Kombination aus Convolutional (über die Bilder) sowie Recurrent (über die Beschreibungen) Neural Network gesteckt. [Zum Paper]]]>