Microsoft Research creează un sistem capabil să genereze automat subtitrări „inteligente”.

Cuprins:
Sigur ați dat peste o legenda care este confuză, incorectă sau spune puțin despre imaginea la care se referă; și chiar este posibil ca, dacă te dedici publicării propriilor articole, să găsești cel mai obositor să completezi această secțiune. Ei bine, cei de la Redmond au creat un instrument care își propune să vă ușureze lucrurile.
O lucrare publicată de Microsoft Research care se descrie ca un „sistem de generare de subtitrări” capabil să imite caracteristicile narative ale limbajului uman, adică o tehnologie care poate descrie capturi de ecran ca despre unul dintre noi, cu contextul său corespunzător.Ceva la care companii precum Facebook, Microsoft și Google lucrează de ceva vreme, dar de această dată depășește așteptările.
În ce constă
În acest fel, sistemul are capacitatea de a spune chiar o poveste completă din mai multe imagini, descriindu-o și spunând-o ca și cum era o carte. Un utilitar care, potrivit experților, ar putea ajunge să devină o caracteristică care oferă o notă mai umană anumitor aplicații, aplicații de recunoaștere a vocii, generând automat descrieri în alte domenii și multe altele.
Și adevărul este că instrument nu se limitează la a spune, pe scurt, ceea ce „vede”, ci oferă mai degrabă un contextul situației care se reflectă în imagine, realizând un „context narativ și stil unic de narațiune”, a explicat Frank Ferraro, unul dintre autorii acestei lucrări.Pentru a ne pune într-o situație, el ne oferă un exemplu
Astfel, noi propunem următorul caz: „Să ne imaginăm că avem un album foto cu niște prieteni care au sărbătorit o zi de naștere într-un Pub. Unele dintre primele imagini arată oameni care comandă bere și o beau, în timp ce ultimele arată pe cineva adormit pe o canapea”, comentează el.
Un sistem convențional „ar putea indica pur și simplu ceva de genul că ar fi o persoană întinsă pe o canapea, în timp ce sistemul nostru ar putea include că probabil că se află în acea situație pentru că este beată după câteva băuturi”. Un adaos care oferă înțelegere și o anumită încărcătură emoțională care se reflectă și prin imaginile și legendele foto incluse în acest articol.
Via | MIT Technology Review
În Xataka Windows | Microsoft lansează o aplicație care determină rasa câinelui tău