Algoritmus od Google vyťahuje tváre z fotiek v rozlíšení 8 x 8 bodov

Autor:: Roman Mališka
Zverejnené:: 8. 2. 2017
Hodnotenie:
Už ste hlasovali.

V rôznych detektívnych seriáloch môžeme často vidieť, ako vyšetrovateľ zo záberu z bezpečnostnej kamery v nízkom rozlíšení dokáže šmahom ruky vytvoriť pekne detailnú podobizeň podozrivého. Zatiaľ čo v tomto prípade ide o filmárske triky, Google už nejakú dobu experimentuje s algoritmom RAISR, ktorý pridá rozmazaným fotografiám detaily a ostrosť obrazu.

Podľa najnovšej správy tímu výskumníkov z projektu Google Brain totiž strojové učenie dokáže posunúť úpravu fotiek na úplne novú úroveň, podobnú zmienenému príkladu s detektívkami. Kým projekt RAISR bol zameraný na ostrosť a jas snímok, nová technológia Pixel Recursive Super Resolution ukazuje možnosti, ako sa z maličkých a hranatých obrázkov s rozmermi 8 x 8 bodov dá vytvoriť niečo oveľa podrobnejšie vo formáte 32 x 32 bodov.

Tento proces funguje tak, že najprv sa použije obrovské množstvo podobných fotiek vo vysokom rozlíšení, v tomto prípade použili výskumníci orezané tváre celebrít. Počítač zníži rozlíšenie týchto záberov až na kockový formát, z ktorého sa voľným okom nedá takmer nič rozoznať. Špeciálny algoritmus sa potom spätne snaží zväčšiť fotky hláv celebrít do rozpoznateľného formátu.

Výskumníci z projektu Google Brain vyvíjajú algoritmus, ktorý dokáže spätne vyskladať záber z obrázku s rozlíšením 8 x 8 bodov

Algoritmus vie identifikovať, kde sa zhruba nachádzajú oči, nos, ústa, vlasy a brada. A po ich nájdení začne z rozsiahlej databázy skorších fotografií vo vysokom rozlíšení čítať, aké druhy obrazových bodov štruktúry sa na danom mieste nachádzajú. Z toho začne budovať odhad toho, ako by mohla rozpixelovaná fotka vyzerať vo vyššom rozlíšení.

Väčšina výsledných fotiek v rozlíšení 32 na 32 bodov však vyzerá skôr desivo alebo komicky, pretože rysy tváre sú pokrútené a je problém rozoznať konkrétnu celebritu. Výskumníci skúšali aj fotografie interiérov spální, kde boli výsledky o niečo lepšie.

Algoritmus vychádza z odhadu proprocií tvárí celebrít, ktoré predtým nasnímal z fotiek vo vysokom rozlíšení

Je teda zrejmé, že sa zatiaľ jedná o dosť obmedzenú technológiu. Zatiaľ teda nemôže slúžiť pre identifikáciu vzdialených osôb zo záberov z bezpečnostných kamier. A to aj preto, že je to technológia založená na učení sa stroja z množstva predtým napozeraných obrázkov a jeho odhadu, čo sa s bodmi deje a kam by mali patriť pri rekonštrukcii záberu z nízkeho do vyššieho rozlíšenia. Je to však demonštrácia schopností učiaceho sa algoritmu a možno je to správny smer pre vybudovanie technológie, ktorá zvládne aj také filmárske zázraky.

Výskumníci testovali algrotimus aj na záberoch interiéru spální, kde boli výsledky o niečo lepšie