Generowanie promptu za pomocą obrazka

Czyli odwrotność promptingu.

Po co?
Często zdarza się że widząc jakąś grafikę wygenerowaną za pomocą AI – jestem strasznie ciekawy, jak wyglądał prompt. Być może wziąłbym taki prompt i trochę z nim poeksperymentował, zmienił to i tamto, i być może wygenerował jakąś totalnie nową scenkę… no ale promptu źródłowego nie mam…
No właśnie. Tu z pomocą przycjodzi narzędzie CLIP interrogator, które skanuje obrazek i wypluwa jego opis. Nie jest to prompt, ale jest to jakiś zalążek przynajmniej.
huggingface.co/spaces/pharma/CLIP-Interrogator

Prompting – generowanie obrazów przez AI na podstawie Twojego opisu.

Aplikacje bazujące na AI (Artificial Intelligence, czyli na Sztucznej Inteligencji) lub na algorytmach opartych na uczeniu maszynowym (Machine Learning – ML) wymagają podania opisu słownego ilustracji lub filmu, który mają wygenerować. Taki opis to tzw. „prompt”.

Prompting – to uzyskiwanie za pomocą algorytmów AI lub ML określonego dzieła (obrazu, ilustracji, mema, filmu, gifa lub innych) na podstawie podania możliwie dokładnego opisu słownego.

Systemy AI do promptingu? Znam trzy najpopularniejsze:

Są płatne, ale na początku dostajesz kilkadziesiąt darmowych prób na zachętę. W Dall-E dodatkowo co miesiąc potem dostajesz 15 darmowych promptów.

Aby jednak rozpocząć promptowanie – trzeba się zarejestrować i poczekać na zaproszenie (nawet kilka tygodni). [edit: w Dall-E już nie trzeba]

Jakie są różnice między tymi aplikacjami?

DE (Dall-E) ma interfejs webowy – w oknie przeglądarki możesz wpisać prompt, poniżej generują się ilustracje. MJ (MidJourney) obsługuje się poprzez Discorda. MJ jest bardziej artystyczny – efekty jego pracy przypominają dzieła sztuki. DE jest bardziej realistyczny – efekty jego pracy bardziej przypominają zdjęcia. Oczywiście zarówno MJ może wygenerować zdjęcie, jak i DE może wygenerować pracę artystyczną – wszystko zależy od promptu.

DE (Dall-E) ma interfejs webowy – w oknie przeglądarki możesz wpisać prompt, poniżej generują się ilustracje. MJ (MidJourney) obsługuje się poprzez Discorda. SD (Stable Diffusion) możesz zainstalować gdzie chcesz.

Co to jest ten prompt?

Prompt to opis (po angielsku) ilustracji jaką chcemy wygenerować za pomocą algorytmu AI. Może to być dowolny opis, dowolnie długi i złożony. Jednak warto zadbać o to żeby był jednoznaczny dla algorytmu. Prompt nie może zawierać zabronionych fraz i słów – zazwyczaj związanych z przemocą i seksem. Lista słów jest niejawna, ale ktoś oczywiście zrobił rozpiskę. Jednocześnie dobrze jest, gdy prompt zawiera dodatkowe parametry opisujące styl tworzonego obrazu, jego dokładność, rozdzielczość, rozmiary i inne elementy.

Porównanie.

Ktoś zrobił porównanie wyników trzech popularnych generatorów AI: https://petapixel.com/2022/08/22/ai-image-generators-compared-side-by-side-reveals-stark-differences/

Udoskonalanie zdjęć w MyHeritage

MyHeritage to w zasadzie kombajn do wszystkiego związanego z drzewem genealogicznym, ale jakiś czas temu wdrożył genialną wręcz usługę poprawiania (głównie starych/nieostrych) zdjęć. Algorytm działa w oparciu o uczenie maszynowe, a wyniki jego pracy są… no cóż – są rzeczywiście niesamowite.

Do tej pory nie widziałem tak dobrej automatycznej maszynki do poprawiania/uwyraźniania fotografii. Co prawda za free można poprawić tylko kilka fotek, ale warto zapłacić (aktualnie około 300 zł/rok) jeśli nie chcemy mieć limitów.
Aplikacja pozwala też kolorować, ale to wychodzi jej raczej przeciętnie (choć nie ustępuje innym usługom tego typu na rynku).
Rzadko polecam płatne usługi, ale to cudo spowodowało u mnie szczery opad szczęki.

myheritage.pl/photo-enhancer


Odnajdź swoją twarz

Ostatnio modne są wszelkie serwisy analizujące/generujące dane graficzne z użyciem AI/uczenia maszynowego. Modne być może dlatego że w ogóle stały się możliwe. Doszliśmy już do takiego poziomu rozwoju możliwości obliczeniowych, że potrafimy w bardzo różnorodny i warygodny jednocześnie sposób, modyfikować grafiki. Następnym krokiem są mateiały video (już się to zaczyna). A co dalej?

Jedną z takich appek jest PimEyes. Ogólnie jest to silnik skanujący Internet (w przede wszystkim serwisy społecznościowe i składnice zdjęć) w poszukiwaniu danej twarzy. Działa nieźle. Zastosowanie: głównie odnajdywanie nieautoryzowanych użyć zdjęć. Ale być może niedługo będzie można zaprząc genetykę i np. odnaleźć zaginioną rodzinę? W każdym razie ciekawa rzecz, na pewno zasługująca na tą wzmiankę.

Kolorowanie zdjęć po rosyjsku

Już kiedyś pisałem o automatycznym kolorowaniu zdjęć.

Od jakiegoś czasu serwis mail.ru oferuje usługę on-line szybkiego kolorowania. Przy okazji poprawia najbardziej widoczne usterki na zdjęciach. Działa to całkiem dobrze, ale kolory nadal się trochę „rozmywają”. Jednak jest to świetna baza do dokładnego, ręcznego kolorowania.
Usługa jest tutaj: https://9may.mail.ru/restoration/?lang=en

Depikselowanie awatarów

Algorytmy potrafią robić niesamowite rzeczy.
Narzędzie Face Depixelizer (offlineowe) zgaduje, jaka twarz została zapikselowana. Robi to w bardzo prosty sposób – generuje twarz, zapikselowuje ją i sprawdza czy kolory pikseli pasują do obrazka wejściowego. Jeśli nie – generuje poprawione zdjęcie tak żeby lepiej pasowało. I tak aż nie „zgadnie” twarzy zapikselowanej. Oczywiście jest ona tylko podobna do oryginalnej (btw fajna metoda na tworzenie podobnych osób). Ale działa. Ciekawostka, być może użyteczna.

Deep Image – inteligentne zwiększanie rozdzielczości zdjęć

Deep Image Beta to webaplikacja, umożliwiająca powiększanie rozdzielczości zdjęć z użyciem uczenia maszynowego (które jest nazywane sztuczną inteligencją). Dodatkowo usuwa artefakty JPEG. Usuwania artefaktów nie testowałem, ale powiększanie rozdzielczości naprawdę nieźle działa. Warto znać.

Automatyczne kolorowanie zdjęć dzięki AI

Kiedyś już pisałem o kolorowaniu zdjęć specjalnym algorytmem (o tutaj), jednak tym razem to co innego. Tym razem wszystko dzieje się automagicznie, automatycznie, w oparciu o sztuczną inteligencję (a raczej o uczenie maszynowe, bo prawdziwa AI jeszcze nie istnieje).

Chodzi o colorize-it.com – stronę na której można automatycznie pokolorować zdjęcie. Na przykład takie jak zdjęcie wyróżniające tego posta. Efekty może i są niezłe, ale niezadowalające dla odbiorcy, szczególnie przy zdjęciach które zawierają obszary o nieoczywistych kolorach, a do tego te obszary przenikają się między sobą:

Jednak po kilku drobnych korektach w Photoshopie – algorytm może być bardzo pomocny. Aczkolwiek – jak dla mnie jest to nadal raczej ciekawostka.

BTW. ostatnio obiło mi się o uszy że Google Photos ma mieć za niedługo opcję automatycznego kolorowania. Ciekawe jak się sprawdzi – w końcu GP ma potężną próbkę zdjęć do uczenia maszynowego…

Generator twarzy

The future is near. Very near.

Stworzono algorytm który generuje twarze. Losowo. Na podstawie fake’owego AI/uczenia maszynowego. Efekty są niesamowite. I porażające.

Oto bowiem możesz w ciągu paru sekund wygenerować zdjęcie twarzy osoby która nie istnieje – losowej płci, rasy i w losowym wieku.
A twarz wygląda jak prawdziwa.

No… prawie. Są artefakty. Algorytm ewidentnie nie radzi sobie z rysowaniem/dopasowywaniem niektórych elementów – głównie zębów oprawek okularów, czasami oczu i włosów (szczególnie na styku z tłem). Czasem też wychodzą koszmarki.
Przy zbieraniu zdjęć do powyższej grafiki, trafiłem na coś takiego:

Creepy, nie?

To tylko próbka, chociaż niektóre zdjęcia wychodzą też idealnie – nie do odróżnienia od prawdziwego zdjęcia.

Przeraża mnie myśl, co będzie za 10 lat? Czy np. aktorzy będą jeszcze potrzebni? Modele? Fotografowie?
Fascynujące i mrożące krew w żyłach zarazem.

Sprawdź generator zdjęć twarzy tutaj: thispersondoesnotexist.com (wystarczy odświeżać).

BTW te fotki to świetny materiał do ćwiczenia retuszu zdjęć lub zdjęcia do avatarów w projektach.