2024-06-08

Dans 2024-06-06_1047 JaiDécidé d’utiliser le terme Inference Engines pour définir la fonction ou la catégorie de Llama.cpp.

J’ai échangé avec un ami au sujet des NPU et j’ai dit que j’avais l’impression que ces puces sont spécialés pour exécuter des Inference Engines, c’est-à-dire, effectuer des calculs d’inférence à partir de modèles.

Après vérification, dans cet article je lis :

An AI accelerator, deep learning processor, or neural processing unit (NPU) is a class of specialized hardware accelerator or computer system designed to accelerate artificial intelligence and machine learning applications, including artificial neural networks and machine vision.

et je comprends que mon impression était fausse. Il semble que les NPU ne sont pas seulement dédiés aux opérations d’exécution d’inférence, mais semblent être optimisés aussi pour faire de l’entrainement 🤔.

Un ami me précise :

Inference Engines

Pour moi, c’est un terme très générique qui couvre tous les aspects du machine learning, du deep learning et des algorithmes type LLM mis en œuvre.

et il me partage l’article Wikipedia Inference engine que je n’avais pas lu quand j’avais rédigé 2024-06-06_1047, honte à moi 🫣.

Dans l’article Wikipedia Inference engine je lis :

In the field of artificial intelligence, an inference engine is a software component of an intelligent system that applies logical rules to the knowledge base to deduce new information.

Additionally, the concept of ‘inference’ has expanded to include the process through which trained neural networks generate predictions or decisions. In this context, an ‘inference engine’ could refer to the specific part of the system, or even the hardware, that executes these operations.

Je comprends qu’un Inference Engines n’effectue pas l’entrainement de modèles.

Pour éviter la confusion,JaiDécidé d’utiliser à l’avenir le terme “Inference Engine (comme LLama.cpp)“.

Le contenu de l’article Wikipedia Llama.cpp augmente mon niveau de confiance dans ce choix de vocabulaire :

llama.cpp is an open source software library written in C++, that performs inference on various Large Language Models such as Llama

notes.sklein.xyz

Notes éphémères

2024-09-17_1707

2024-09-16_1754

2024-09-15_1518

2024-09-15_1038

2024-09-14_2253

Projets

Projet 13 - "POC Elasticsearch sur un PKM"

Je cherche à convertir en SQL des query de filtre basé sur un système de "tags"

Projet 12 - "Implémentation nodemailer-scaleway-transport"

Projet 11 - "Première version d'un moteur web PKM"

Projet 10 - "Mettre en oeuvre DotTXT AI"

2024-06-08_1035

Vue Graphique

Liens retour