CUPERTINO / LONDON (IT BOLTWISE) – Apple hat ein neues KI-Modell entwickelt, das die Analyse von Langformvideos revolutioniert. Die Forscher des Unternehmens haben eine angepasste Version des SlowFast-LLaVA-Modells vorgestellt, die größere Modelle in der Videoanalyse übertrifft.

 Heutiger Tagesdeal bei Amazon!  ˗ˋˏ$ˎˊ˗

Apple hat kürzlich ein bedeutendes Fortschritt in der Videoanalyse mit Künstlicher Intelligenz erzielt. Das Unternehmen hat eine verbesserte Version des SlowFast-LLaVA-Modells entwickelt, das in der Lage ist, Langformvideos effizient zu analysieren und zu verstehen. Diese Entwicklung ist besonders bemerkenswert, da das Modell größere Modelle in der Leistung übertrifft, obwohl es weniger Parameter verwendet.

Das Modell arbeitet, indem es Videos in einzelne Frames aufteilt und diese mit Computer Vision-Techniken analysiert. Dabei werden visuelle Merkmale extrahiert und deren Veränderungen über die Zeit hinweg untersucht. Diese Informationen werden dann mit Sprache abgeglichen, um das Video in Textform zu beschreiben oder zu interpretieren. Eine Herausforderung bei der Videoanalyse ist die große Menge an redundanten Informationen, die durch die Analyse jedes einzelnen Frames entsteht. Dies kann dazu führen, dass das Kontextfenster eines Modells überschritten wird, was die Effizienz beeinträchtigt.

Apple hat diese Herausforderung durch die Anpassung des SlowFast-LLaVA-Modells gemeistert. Das Modell verwendet einen zweigleisigen Ansatz: einen langsamen Stream, der weniger Frames in höherer Detailtiefe betrachtet, und einen schnellen Stream, der mehr Frames in geringerer Detailtiefe analysiert. Diese Methode ermöglicht es, die räumlichen und zeitlichen Hinweise effizient zu kombinieren, ohne die Bildverarbeitung zu beeinträchtigen.

Die Ergebnisse sind beeindruckend. Auf Benchmarks wie LongVideoBench und MLVU hat das Modell neue Maßstäbe gesetzt und übertrifft selbst größere Modelle. Darüber hinaus zeigt das Modell auch bei Bildaufgaben eine starke Leistung, was seine Vielseitigkeit unterstreicht. Trotz dieser Erfolge gibt es noch Raum für Verbesserungen, insbesondere in Bezug auf die maximale Eingabelänge von 128 Frames, was in einigen Fällen wichtige Informationen übersehen könnte.

Apple hat das Modell auf öffentlichen Datensätzen trainiert und es als Open-Source-Modell auf Plattformen wie GitHub und Hugging Face verfügbar gemacht. Diese Offenheit könnte die Weiterentwicklung und Anpassung des Modells durch die Community fördern und zu weiteren Fortschritten in der KI-gestützten Videoanalyse führen.




Hat Ihnen der Artikel bzw. die News - Apple entwickelt effizientes KI-Modell zur Videoanalyse - gefallen? Dann abonnieren Sie uns doch auf Insta: AI News, Tech Trends & Robotics - Instagram - Boltwise

Unseren KI-Morning-Newsletter «Der KI News Espresso» mit den besten KI-News des letzten Tages gratis per eMail - ohne Werbung: Hier kostenlos eintragen!


Apple entwickelt effizientes KI-Modell zur Videoanalyse
Apple entwickelt effizientes KI-Modell zur Videoanalyse (Foto: DALL-E, IT BOLTWISE)



Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.









Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "Apple entwickelt effizientes KI-Modell zur Videoanalyse".
Stichwörter AI Apple Artificial Intelligence Bildverarbeitung Computer Vision KI Künstliche Intelligenz Langformvideos Slowfast-llava Videoanalyse
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!

Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Apple entwickelt effizientes KI-Modell zur Videoanalyse" für unsere Leser?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

  • Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)


  • Es werden alle Kommentare moderiert!

    Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

    Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

    Du willst nichts verpassen?

    Du möchtest über ähnliche News und Beiträge wie "Apple entwickelt effizientes KI-Modell zur Videoanalyse" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
    Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Apple entwickelt effizientes KI-Modell zur Videoanalyse« bei Google Deutschland suchen, bei Bing oder Google News!

    336 Leser gerade online auf IT BOLTWISE®
    KI-Jobs