LLM (Large Language Model)

Table of Contents

Referências

Não existe uma "Inteligência" real por trás desses modelos, na verdade esse aprendizado acontece em um nível mais profundo, consiste em algoritmos que fazem relações entre um determinado assunto/termo com outros semelhantes (semântica), por meio da utilização de vetores. Como os modelos são treinados com muitos dados, a IA acaba por ter uma janela de contexto muito ampla sobre qualquer assunto para o qual foi treinada.

Desinformação gerada por IAs

Importante notar que a qualidade e tipos de respostas de um modelo, irá depender da qualidade do material que foi fornecido no treinamento, por esse motivo, esse é um dos assuntos mais discutidos atualmente, veja -- The impact of AI on disinformation and democracy

O Large por trás da sigla, faz referência a complexidade e poder de processamento necessários para a execução dos modelos, por esse motivo a maioria dos LLMs disponíveis atualmente são oferecidos por meio de APIs ou aplicações externas.

Existe ainda uma recente discussão sobre os Small Language Models, com um poder de processamento menor, mas que podem ser executados em ambientes "menos robustos".

Referências

ACADEMY, Data Science Academy. O que são LLMs?

ACADEMY, Data Science Academy. LLMs e tipos emergentes de modelos de linguagem.

COHERE. Introduction to Large Language Models.

WIGGERS, Kyle. The emerging types of language models and why they matter.