Google har utviklet et nevralt nettverk som gjenskaper tapte fragmenter av latinske inskripsjoner

Av: Viktor Tsyrfa | i går, 01:53
Et historisk bilde av latinsk skriving: ingen mellomrom mellom ordene Et eksempel på latinsk skriving. På grunn av plassmangel var det ofte ingen mellomrom mellom ordene. Kilde: Getty Images

Google DeepMind har utviklet et åpent nevralt nettverk kalt Aeneas som kan hjelpe til med å gjenopprette gamle skadde latinske inskripsjoner. De gamle romerne etterlot seg mange skriftlige monumenter, men ikke alle har blitt bevart i perfekt stand. Mange av dem er skadde, og de fleste har kun nådd oss i form av fragmenter. Aeneas hjelper til med å gjenopprette de tapte delene av teksten.

Bronse militær diplom fra Sardinia restaurert
Et restaurert bronse militær diplom fra Sardinia, tildelt av keiser Trajan til en sjømann på et krigsskip. Illustrasjon: predictingthepast.com/aeneas

Hold skepsisen i sjakk

Ja, nevrale nettverk kan gjøre feil og oppfinne ting som ikke eksisterer. Men Google nærmet seg oppgaven med en vitenskapelig tilnærming - for å gjenopprette teksten, trenger det nevrale nettverket kontekst. Ved å kjenne perioden som funnet tilhører og stedet for oppdagelsen, analyserer det nevrale nettverket vokabularet funnet på monumentene fra den tiden, samt hendelser relevante for den tiden, for å gjette de tapte ordene så nøyaktig som mulig. Gir dette garanti for at Aeneas vil gjenskape den originale inskripsjonen uten feil? Selvfølgelig ikke, det er umulig. Men det vil gjøre en virkelig god jobb, basert på en vitenskapelig tilnærming og de kraftige mulighetene til moderne teknologi. Denne oppgaven er spesielt vanskelig for monumenter der selv lengden på det tapte fragmentet er ukjent. Så ja, det gir ikke 100% garanti for autentisitet. Men for monumenter som er uopprettelig skadde, vil vi ikke kunne oppnå bedre resultater. I det minste inntil oppfinnelsen av en tidsmaskin.

Tekniske detaljer om Aeneas

  • Modellen oppfatter både tekst og bilder
  • Trent på ~176 000 latinske tegn, totalt 16 millioner tegn
  • Oppkalt etter en mytisk helt fra den trojanske epos
  • Opprettet i samarbeid med DeepMind og forskere fra universitetene i Nottingham, Warwick, Oxford og Athen
  • Attribution: bestemmer hvor (avhengig av en av 62 provinser) og når (nøyaktig til ~13 år) inskripsjonen ble laget
  • Effektivitet: med opptil 10% av tegnene skadde, er korrekt alternativ 73% av tiden; selv uten å vite lengden - 58%
  • Søke etter analoge: finner paralleller i stil, form, og kontekst

En interaktiv versjon av Aeneas er tilgjengelig på predictingthepast.com, og koden og databasen er åpne for forskere.

Hvorfor det betyr noe

Nevrale nettverk er veldig flinke til å finne mønstre i store mengder informasjon, der det er veldig vanskelig for mennesker å identifisere relasjoner. Derfor vil denne tilnærmingen hjelpe til med å gjenskape litt mer historisk informasjon. Selv om du gjør en feil i spesifikke ord, kan Aeneas foreslå hovedmeldingen i teksten.

Kilde: www.engadget.com