Te-ai intrebat vreodata cum smartphone-urile Pixel 2 de la Google fac fotografii impresionante in modul portret? Google a deschis tehnologia de inteligenta artificiala catre public.
Numit DeepLab 3+, tehnologia "utilizeaza o retea neuronala pentru a detecta contururile obiectelor din campul vizual al camerei dvs." Acest lucru permite unei camere sa castige o profunzime mai mare a campului si sa identifice cu mai multa precizie obiectele pe care le vede.Aceasta versiune include modelele DeepLab-v3 + construite pe baza unei arhitecturi puternice a retelei neuronale convolutionale (CNN) pentru rezultatele cele mai exacte, destinate implementarii pe server. Ca parte a acestei comunicari, participam, de asemenea, la instruirea si codul nostru de evaluare TensorFlow, precum si la modele deja pregatite pentru sarcinile de segmentare semantica Pascal VOC 2012 si Cityscapes .Puteti sa luati codul pentru DeepLab 3+ de la GitHub si sa aflati mai multe despre modul in care functioneaza tehnologia .De la prima incarnare a modelului nostru DeepLab acum trei ani, imbunatatirea functiilor de extragere a caracterelor CNN, modelarea pe scara mai buna a obiectelor, asimilarea atenta a informatiilor contextuale, procedurile imbunatatite de instruire si hardware-ul si software-ul din ce in ce mai puternic au dus la imbunatatiri cu DeepLab-v2 si DeepLab-v3. Cu DeepLab-v3 +, extindem DeepLab-v3 prin adaugarea unui modul de decodor simplu dar eficient pentru a rafina rezultatele segmentarii in special de-a lungul limitelor obiectului. Aplicam suplimentar convolutia separabila la adancime atat la modulele piramidale spatiale atragatoare, cat si la modulele de decodor, rezultand o retea mai rapida si mai puternica de encoder-decodor pentru segmentarea semantica.
Liang-Chieh Chen si Yukun Zhu, ingineri de software