Apple legt «Siri AI» offen: Fünf Modelle, kein Google-Code

«Private Cloud Compute» läuft künftig auch auf Google-Servern mit Nvidia-Technik

Apple hat an der diesjährigen Entwicklerkonferenz «WWDC26» im Detail erläutert, wie die neue «Siri AI» und das überarbeitete Apple Intelligence funktionieren. Im Zentrum steht eine dritte Generation der «Apple Foundation Models», die zwar in Zusammenarbeit mit Google entstanden ist – im laufenden System nach Apples Angaben aber keinen Google-Code, keine von Google ausgelieferten Modelle und nicht die Google-Suche nutzt. Für die anspruchsvollsten Aufgaben weitet Apple sein «Private Cloud Compute» neu auf Google-Server mit Nvidia-Chips aus.

Stefan Rechsteiner

An einem Presse-«Tech Talk» im Anschluss an die Eröffnungs-Keynote der «Worldwide Developers Conference» hat ein Apple-Team rund um Software-Chef Craig Federighi aufgezeigt, wie die neue «Siri AI» und das überarbeitete Apple Intelligence* in den kommenden OS-Generationen (macOS 27, iOS 27 und Co.) aufgebaut sind. Mit auf der Bühne waren Apples KI-Vizepräsident Amar Subramanya, der Siri-Verantwortliche Mike Rockwell und Software-Vizepräsident Sebastien Marineau-Mes.

Im Mittelpunkt stand die Frage, welche Rolle Google spielt. Anfang Jahr hatte Apple bestätigt, für die neue Siri auf die Technologie hinter Googles «Gemini»-Modellen zu setzen – ohne dabei jedoch viele Details zu nennen. Federighi stellte nun klar: Der Anteil an Google Assistant, der zum Einsatz komme, sei «gleich null». Apple verwende weder die «Gemini»-App noch deren Client-Code, weder die Modelle, die Google an seine eigene Kundschaft ausliefert, noch deren Infrastruktur – und auch nicht die Google-Suche als Wissensbasis.

Fünf «Apple Foundation Models» – trainiert mit Gemini-Ausgaben

Apples Marketing-Chef Greg «Joz» Joswiak fasst die Rollenverteilung in einem separaten Interview so zusammen: Google habe beeindruckende Frontier-Modelle entwickelt, gemeinsam sei daraus «ein völlig neues Set an Modellen» entstanden. «Wir nutzen einige der Ausgaben des Frontier-Modells dafür, aber das sind komplett neue Modelle, die eigens als Apple Foundation Models geschaffen wurden», so Joswiak. Es handle sich nicht um «Gemini, wie es jemand über eine Gemini-App oder den gewohnten Gemini-Dienst nutzen würde», sondern um Gemini-Technologie im Rahmen der Kooperation.

Diese dritte Generation der «Apple Foundation Models» (kurz «AFM 3») reicht von auf den Geräten («On Device») bis in die Cloud. Subramanya stellte fünf Modelle vor: Auf dem Gerät arbeiten «AFM 3 Core» (mit dichter Architektur) und das neue «AFM 3 Core Advanced» – ein 20-Milliarden-Parameter-Modell mit spärlich besetzter («sparse») Architektur, das je nach Anfrage nur 1 bis 4 Milliarden Parameter aktiviert. Es ist nativ multimodal und ermöglicht etwa ausdrucksstärkere Stimmen und eine genauere Diktierfunktion vollständig lokal. Serverseitig folgen «AFM 3 Cloud» (auf Latenz optimiert), «AFM 3 Cloud Image» (für Bild-Erzeugung und -Bearbeitung) sowie «AFM 3 Cloud Pro» für besonders anspruchsvolle Aufgaben wie «agentische» Werkzeugnutzung und komplexes Schlussfolgern.

Hier kommt Google ins Spiel: Die vier für Apple Silicon massgeschneiderten Modelle – «AFM 3 Core», «AFM 3 Core Advanced», «AFM 3 Cloud» und «AFM 3 Cloud Image» – seien mit proprietären Daten trainiert und mit den Ausgaben von Googles Spitzenmodellen verfeinert worden, so Subramanya. Googles Beitrag erfolgte demnach über Distillation und Training – nicht durch eine Übernahme von Gemini selbst.

Eine Sonderrolle spielt «AFM 3 Cloud Pro»: Es ist als einziges der fünf Modelle nicht für Apple Silicon, sondern für die Nvidia-GPU optimiert und weist zugleich die stärkste Gemini-Abstammung auf. Apple beschreibt es als eigenes Modell, das mit den Ausgaben von Googles Spitzenmodellen verfeinert wurde; Berichten zufolge wurde es aus einem lizenzierten Gemini-Modell destilliert, ehe Apple eigenes Pre- und Post-Training daraufsetzte. Seine Qualität sei jener der «Gemini»-Spitzenmodelle ähnlich.

«System Orchestrator» und Private Cloud Compute auf Google-Servern

Das Zusammenspiel steuert laut Federighi ein «System Orchestrator», den er als zentral für die Datenschutz-Architektur des gesamten Systems bezeichnete. Er leitet jede Anfrage an das passende Modell – auf dem Gerät oder in der Cloud – und greift dabei auf eine «App Toolbox» für In-App-Aktionen, einen «Spotlight Semantic Index» für persönliche Inhalte sowie den Bildschirm-Kontext zu. Für Fragen zu aktuellem Weltwissen nutzt Apple einen eigenen «World Knowledge Service».

Anspruchsvollere Anfragen wandern in Apples «Private Cloud Compute» (kurz «PCC»). Dieses System weitet Apple neu über die eigenen Rechenzentren hinaus aus: Für «AFM 3 Cloud Pro» arbeitet der Konzern mit Google und Nvidia zusammen und betreibt Nvidia-Grafikchips in Googles Cloud-Infrastruktur. Neu an PCC auf Google Cloud sei laut Apple die konkrete Umsetzung: Nvidia-GPU mit «Confidential Computing», Intel-Prozessoren mit der Sicherheitstechnik «TDX» sowie Googles «Titan»-Chip sollen verhindern, dass die Server die Inhalte der Apple-Anfragen lesen können. Apple betont, die zentralen PCC-Eigenschaften – zustandslose Verarbeitung, durchsetzbare Garantien, keine privilegierten Laufzeit-Zugriffe, Nicht-Adressierbarkeit und überprüfbare Transparenz – blieben auch bei der neuen Architektur unverändert. Zusätzlich führe Apple ein kryptografisch überprüfbares Verzeichnis aller eingesetzten Google-Cloud-Hardware, um das Risiko von Lieferketten-Angriffen einzudämmen. Unabhängige Sicherheitsforschende sollen die eingesetzten Server weiterhin überprüfen können; die PCC-Software auf Google Cloud werde noch schrittweise vervollständigt.

Gönner-Abo

Ab CHF 5.– im Monat

👉🏼 Wir benötigen deine Unterstützung! Unterstütze macprime mit einem freiwilligen Gönner-Abo und mache die Zukunft unseres unabhängigen Apple-Mediums aus der Schweiz mit möglich.

macprime unterstützen

Kommentare

Anmelden um neue Kommentare zu verfassen

Allegra Leser! Nur angemeldete Nutzer können bei diesem Inhalt Kommentare hinterlassen. Jetzt kostenlos registrieren oder mit bestehendem Benutzerprofil anmelden.