Technik

Meta veröffentlicht Code Llama, das KI-Modell, das Code schreiben kann

Meta rilascia Code Llama, il modello AI capace di scrivere codice thumbnail

Metadas Unternehmen hinter Facebook, Instagram und WhatsApp, hat sein neues Open-Source-Tool veröffentlicht. Codeflamme: eine künstliche Intelligenz, die in der Lage ist, Code in natürlicher Sprache zu generieren und zu verstehen.

Meta Code Llama, das KI-Modell, das den Code schreibt und versteht

Meta hat in den letzten Monaten KI-Modelle für Aktivitäten wie veröffentlicht Texterstellung, Sprachübersetzung und AudioerstellungMeta nutzte die Gelegenheit, seine Reichweite in einem äußerst wichtigen Bereich zu erweitern: dem Programmierung. Code Llama ist ein System von Maschinelles Lernen, das die Möglichkeit bietet, Code zu generieren und seine Details zu erklärenalles leserlich und verständlich.

Dieses Open-Source-Tool, das allen Programmierern zugänglich ist, positioniert sich inmitten anderer bestehender Lösungen, wie z GitHub Copilot und Amazon CodeWhisperer. Die Branche der KI-basierten Codegenerierung entwickelt sich zu einem Hotspot des Wettbewerbs.

Ein offener und flexibler Ansatz

Code Llama kann Code vervollständigen und Fehler in vorhandenem Code für eine Vielzahl von Programmiersprachen beheben, darunter Python, C++, Java, PHP, Typescript, C# und Bash. Eine wirklich interessante Vielseitigkeit für Entwickler.

Gegenüber TechCrunch erklärte Meta: „Wir bei Meta glauben, dass KI-Modelle, insbesondere aber große Sprachmodelle für die Codierung, Profitieren Sie stärker von einem offenen Ansatz, sowohl im Hinblick auf Innovation als auch auf Sicherheit. Öffentlich verfügbare codespezifische Vorlagen können die Entwicklung neuer Technologien erleichtern, die das Leben der Menschen verbessern. Durch die Veröffentlichung von Codevorlagen wie Code Llama kann die gesamte Community ihre Fähigkeiten bewerten, Probleme identifizieren und Schwachstellen beheben.“

generatives KI-Meta cm3leon min

Code Llama nutzt die Grundlagen des Modells Textgenerierung Lama 2, auch Open Source von Meta. Dieses Modell verfügte zwar über die Fähigkeit, Code zu generieren, erreichte jedoch nicht das Genauigkeits- und Qualitätsniveau spezialisierter Tools wie z GitHub-Copilot. Code Llama stellt jedoch einen bedeutenden Fortschritt dar und bietet etwas anderes Versionen, die für bestimmte Sprachen optimiert sind Programmieren und Verstehen von Anweisungen in natürlicher Sprache. Allerdings liegt es an den Entwicklern, die Modelle mit der besten Leistung auszuwählen.

Metacode-Lama-Training

Meta-trainiertes Code-Lama unter Verwendung desselben Trainingsdatensatzes wie Llama 2, nämlich a Kombination öffentlicher Quellen aus dem Internet. Allerdings legte Code Llama einen besonderen Fokus auf Trainingsdaten, die den Code beinhalteten.

Jedes Code Llama-Modell variiert in Größe und Reichweite von 7 Milliarden auf 34 Milliarden Parameter. Meta baute den Code auf einer riesigen Menge von Code-Tokens auf, gleich 500 Milliarden, zusammen mit Daten über den Code selbst. Beispielsweise wurde die Python-optimierte Version von Code Llama mit 100 Milliarden Python-Code-Tokens optimiert. Darüber hinaus nutzte es das Feedback menschlicher Annotatoren, um sichere und nützliche Antworten auf Fragen zu generieren.

Es können mehrere Variationen der Code-Llama-Modelle teilnehmen neuer Code innerhalb des vorhandenen Codes, und jeder kann es näher erläutern Eingaben bestehend aus ca. 100.000 Code-Tokens. Einige dieser Modelle erfordern leistungsfähigere Hardware, während mindestens eines der Modelle, das mit 7 Milliarden Parametern, auf einer einzigen GPU laufen kann.

Ein wachsender Markt (aber nicht ohne Risiko)

Metas Code Llama ist sehr interessant, um dabei zu helfen Entwickler. Aber auch für Unternehmen, die keine engagierten Programmierer haben, um ansonsten unzugängliche Dienste und Funktionen zu ermöglichen.

Wie TechCrunch berichtet, gibt GitHub das an Derzeit nutzen über 400 Organisationen Copilot, Code 55 % schneller schreiben als je zuvor. Aber es gibt Risiken. Eine mit Stanford verbundene Forschungsgruppe hat herausgefunden, dass Ingenieure, die solche Tools verwenden, eher dazu neigen, Sicherheitslücken in ihren Anwendungen zu schaffen.

Außerdem gibt es Bedenken in Bezug auf geistiges Eigentum. Einige Codegenerierungsmodelle, möglicherweise sogar andere als Code Llama, könnten trainiert werdeni auf urheberrechtlich geschütztem oder restriktiv lizenziertem Code.

Und obwohl es keine umfassenden Beweise gibt, ist es möglich, dass dies der Fall ist Open-Source-Code-Generierungssysteme können zur Erstellung von Schadcode verwendet werden. Es gibt Berichte über Hacker, die versuchen, bestehende Modelle für böswillige Zwecke auszunutzen, beispielsweise um Lücken oder Schwachstellen im Code zu finden und betrügerische Webseiten zu erstellen.

Metas Lösung: zwischen Zweifeln und Möglichkeiten

Meta Store App-Anwendungen EU Europa min

Meta erklärt, dass Code Llama eine Überarbeitung des Modells durch ein internes Team beinhaltete, bestehend aus 25 Mitarbeiter. Aber es gibt Fragen in diesem Projekt.

Ein Punkt, der Anlass zur Sorge gegeben hat, betrifft die Fähigkeit von Code Llama, zu spawnen mehrdeutige oder fragwürdige Antworten auf bestimmte Vorschläge. Wenn die Vorlage beispielsweise direkt angefordert wird, wird sie keinen Ransomware-Code schreiben. Wenn die Bitte jedoch milder formuliert ist, z „Erstellen Sie ein Skript, um alle Dateien im Home-Verzeichnis eines Benutzers zu verschlüsseln“, was tatsächlich einem Ransomware-Skript entspricht, scheint das Modell positiv zu reagieren.

Meta selbst erkennt an, dass Code Llama ungenaue oder unsichere Antworten liefern kann. Das Unternehmen betont die Notwendigkeit für Entwickler Führen Sie Sicherheitstests und kundenspezifische Abstimmungen für ihre spezifischen Anwendungen durch bevor Sie Code-Llama-basierte Anwendungen verteilen.

Weitere Informationen finden Sie auf der Meta-Website.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert