Algoritmus od Google vyťahuje tváre z fotiek v rozlíšení 8 x 8 bodov
- Autor:
- Roman Mališka
- Zverejnené:
- 8. 2. 2017
- Hodnotenie:
- Už ste hlasovali.
V rôznych detektívnych seriáloch môžeme často vidieť, ako vyšetrovateľ zo záberu z bezpečnostnej kamery v nízkom rozlíšení dokáže šmahom ruky vytvoriť pekne detailnú podobizeň podozrivého. Zatiaľ čo v tomto prípade ide o filmárske triky, Google už nejakú dobu experimentuje s algoritmom RAISR, ktorý pridá rozmazaným fotografiám detaily a ostrosť obrazu.
Podľa najnovšej správy tímu výskumníkov z projektu Google Brain totiž strojové učenie dokáže posunúť úpravu fotiek na úplne novú úroveň, podobnú zmienenému príkladu s detektívkami. Kým projekt RAISR bol zameraný na ostrosť a jas snímok, nová technológia Pixel Recursive Super Resolution ukazuje možnosti, ako sa z maličkých a hranatých obrázkov s rozmermi 8 x 8 bodov dá vytvoriť niečo oveľa podrobnejšie vo formáte 32 x 32 bodov.
Tento proces funguje tak, že najprv sa použije obrovské množstvo podobných fotiek vo vysokom rozlíšení, v tomto prípade použili výskumníci orezané tváre celebrít. Počítač zníži rozlíšenie týchto záberov až na kockový formát, z ktorého sa voľným okom nedá takmer nič rozoznať. Špeciálny algoritmus sa potom spätne snaží zväčšiť fotky hláv celebrít do rozpoznateľného formátu.
Algoritmus vie identifikovať, kde sa zhruba nachádzajú oči, nos, ústa, vlasy a brada. A po ich nájdení začne z rozsiahlej databázy skorších fotografií vo vysokom rozlíšení čítať, aké druhy obrazových bodov štruktúry sa na danom mieste nachádzajú. Z toho začne budovať odhad toho, ako by mohla rozpixelovaná fotka vyzerať vo vyššom rozlíšení.
Väčšina výsledných fotiek v rozlíšení 32 na 32 bodov však vyzerá skôr desivo alebo komicky, pretože rysy tváre sú pokrútené a je problém rozoznať konkrétnu celebritu. Výskumníci skúšali aj fotografie interiérov spální, kde boli výsledky o niečo lepšie.
Je teda zrejmé, že sa zatiaľ jedná o dosť obmedzenú technológiu. Zatiaľ teda nemôže slúžiť pre identifikáciu vzdialených osôb zo záberov z bezpečnostných kamier. A to aj preto, že je to technológia založená na učení sa stroja z množstva predtým napozeraných obrázkov a jeho odhadu, čo sa s bodmi deje a kam by mali patriť pri rekonštrukcii záberu z nízkeho do vyššieho rozlíšenia. Je to však demonštrácia schopností učiaceho sa algoritmu a možno je to správny smer pre vybudovanie technológie, ktorá zvládne aj také filmárske zázraky.