Google deschide sursele instrumentelor AI pentru camere foto

Featured Romana Google deschide sursele instrumentelor AI pentru camere foto

Te-ai intrebat vreodata cum smartphone-urile Pixel 2 de la Google fac fotografii impresionante in modul portret? Google a deschis tehnologia de inteligenta artificiala catre public.

Deeplab_LOGO

Numit DeepLab 3+, tehnologia "utilizeaza o retea neuronala pentru a detecta contururile obiectelor din campul vizual al camerei dvs." Acest lucru permite unei camere sa castige o profunzime mai mare a campului si sa identifice cu mai multa precizie obiectele pe care le vede.

Aceasta versiune include modelele DeepLab-v3 + construite pe baza unei arhitecturi puternice a retelei neuronale convolutionale (CNN) pentru rezultatele cele mai exacte, destinate implementarii pe server. Ca parte a acestei comunicari, participam, de asemenea, la instruirea si codul nostru de evaluare TensorFlow, precum si la modele deja pregatite pentru sarcinile de segmentare semantica Pascal VOC 2012 si Cityscapes .
De la prima incarnare a modelului nostru DeepLab acum trei ani, imbunatatirea functiilor de extragere a caracterelor CNN, modelarea pe scara mai buna a obiectelor, asimilarea atenta a informatiilor contextuale, procedurile imbunatatite de instruire si hardware-ul si software-ul din ce in ce mai puternic au dus la imbunatatiri cu DeepLab-v2 si DeepLab-v3. Cu DeepLab-v3 +, extindem DeepLab-v3 prin adaugarea unui modul de decodor simplu dar eficient pentru a rafina rezultatele segmentarii in special de-a lungul limitelor obiectului. Aplicam suplimentar convolutia separabila la adancime atat la modulele piramidale spatiale atragatoare, cat si la modulele de decodor, rezultand o retea mai rapida si mai puternica de encoder-decodor pentru segmentarea semantica.
Liang-Chieh Chen si Yukun Zhu, ingineri de software

Puteti sa luati codul pentru DeepLab 3+ de la GitHub si sa aflati mai multe despre modul in care functioneaza tehnologia .