LLaVA: Multimodales offenes KI-Modell auf LLaMA-Basis liest Bilder und Sprache from Heise's blog

Die Forschungsdemo des Large Language and Vision Assistant erlaubt Usern das Hochladen eigener Bilder zum Testen multimodaler Fähigkeiten und sammelt Feedback.

Source: https://www.heise.de/news/LLaVA-Multimodales-offenes-KI-Modell-auf-LLaMA-Basis-liest-Bilder-und-Sprache-8974975.html?wt_mc=rss.red.ho.ho.rdf.beitrag.beitrag

Blog home

The Wall

No comments

You need to sign in to comment

Post

By	Heise
Added	Apr 22 '23, 12:56PM

Rate

Your rate:

Total: (0 rates)

Redline-IT

Please sign in

LLaVA: Multimodales offenes KI-Modell auf LLaMA-Basis liest Bilder und Sprache from Heise's blog

The Wall

Post

Tags

Rate

Archives