CUPERTINO / LONDON (IT BOLTWISE) – Apple hat ein neues KI-Modell entwickelt, das die Analyse von Langformvideos revolutioniert. Die Forscher des Unternehmens haben eine angepasste Version des SlowFast-LLaVA-Modells vorgestellt, die größere Modelle in der Videoanalyse übertrifft.

Apple hat kürzlich ein bedeutendes Fortschritt in der Videoanalyse mit Künstlicher Intelligenz erzielt. Das Unternehmen hat eine verbesserte Version des SlowFast-LLaVA-Modells entwickelt, das in der Lage ist, Langformvideos effizient zu analysieren und zu verstehen. Diese Entwicklung ist besonders bemerkenswert, da das Modell größere Modelle in der Leistung übertrifft, obwohl es weniger Parameter verwendet.
Das Modell arbeitet, indem es Videos in einzelne Frames aufteilt und diese mit Computer Vision-Techniken analysiert. Dabei werden visuelle Merkmale extrahiert und deren Veränderungen über die Zeit hinweg untersucht. Diese Informationen werden dann mit Sprache abgeglichen, um das Video in Textform zu beschreiben oder zu interpretieren. Eine Herausforderung bei der Videoanalyse ist die große Menge an redundanten Informationen, die durch die Analyse jedes einzelnen Frames entsteht. Dies kann dazu führen, dass das Kontextfenster eines Modells überschritten wird, was die Effizienz beeinträchtigt.
Apple hat diese Herausforderung durch die Anpassung des SlowFast-LLaVA-Modells gemeistert. Das Modell verwendet einen zweigleisigen Ansatz: einen langsamen Stream, der weniger Frames in höherer Detailtiefe betrachtet, und einen schnellen Stream, der mehr Frames in geringerer Detailtiefe analysiert. Diese Methode ermöglicht es, die räumlichen und zeitlichen Hinweise effizient zu kombinieren, ohne die Bildverarbeitung zu beeinträchtigen.
Die Ergebnisse sind beeindruckend. Auf Benchmarks wie LongVideoBench und MLVU hat das Modell neue Maßstäbe gesetzt und übertrifft selbst größere Modelle. Darüber hinaus zeigt das Modell auch bei Bildaufgaben eine starke Leistung, was seine Vielseitigkeit unterstreicht. Trotz dieser Erfolge gibt es noch Raum für Verbesserungen, insbesondere in Bezug auf die maximale Eingabelänge von 128 Frames, was in einigen Fällen wichtige Informationen übersehen könnte.
Apple hat das Modell auf öffentlichen Datensätzen trainiert und es als Open-Source-Modell auf Plattformen wie GitHub und Hugging Face verfügbar gemacht. Diese Offenheit könnte die Weiterentwicklung und Anpassung des Modells durch die Community fördern und zu weiteren Fortschritten in der KI-gestützten Videoanalyse führen.

- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Duales Studium Informatik/Künstliche Intelligenz (B.Sc.), Campusmodell Sindelfingen/Stuttgart 2026 (w/m/d)

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

Duales Studium Data Science und Künstliche Intelligenz (w/m/d) 2026

AI Solution Support (m/w/d)

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Apple entwickelt effizientes KI-Modell zur Videoanalyse" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Apple entwickelt effizientes KI-Modell zur Videoanalyse" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Apple entwickelt effizientes KI-Modell zur Videoanalyse« bei Google Deutschland suchen, bei Bing oder Google News!