Terminologia
Eu coloquei aqui os principais jargões e conceitos relacionados à área de AI Engineering afim de sabermos o que cada buzz word quer dizer de verdade bem como as fontes de onde esses resumos foram tirados.
Conceitos
Prompt Engineering
É a arte de criar inputs para os modelos que produzam resultados acurados, constantes e úteis. Normalmente, usando contexto, instrução e exemplo para direcionar o resultado corretamente.
Retrieval-Augmented Generation - RAG
Abordagem que combina a recuperação de informação com um modelo para criar retornos contextualizados. Primeiro, coletamos informação relevante em uma knowledge base para, depois, consultar o LLM para gerar respostas baseadas nessa informação.
Fontes: Datacamp, Google, Youtube
AI Agents
Criados por instruções, conhecimento e ações. São softwares criados para executar tarefas mas que possuem uma ampla habilidade de decidir o "como" fazer essas tarefas. No core de um agent estão as LLMs que, por si só, não produzem nada além de texto.
Fontes: Youtube, Play.ht, Langchain
AI Agent Developer
Alguém que é responsável por customizar LLMs contidas em AI Agents para processos dedicados e internos como empresas de modo que a AI consegue ter acesso à ferramentas, conhecimento, infra necessária para realmente ter impacto nas empresas.
Fontes: Youtube, Play.ht, Langchain
Vector Databases
São modelos de banco de dados otimizados para encontrar proximidade entre seus elementos uma vez que guardam valores baseados em uma lista de números. Além disso, permitem long term memory para modelos de aprendizado de máquina existentes de modo que, sem eles, seria necessário fazer o treinamento específico (chamado de fine-tuning) para adicionar novos conhecimentos aos LLMs. São centrais para RAG também.
Fontes: Cloudflare, Mongodb
Embedding
Processo de converter inputs em vetores numéricos de várias dimensões. Desse modo, os modelos conseguem encontrar relações de similaridade baseado nos valores dos vetores.
Fontes: Youtube,Cloudflare,IBM
Model Training
É o processo de usar um dataset para consumo de um algoritmo de ML de modo que o resultado da ingestão da informação é comparado com o resultado da amostra para que o modelo produza resultados próximos do esperado. Pode ser supervisionado ou não.
Fontes: AWS Documentation, Domino AI Blog, Oden Glossary
Inferência
É o processo que um modelo já treinado usa para definir o output para dados novos. Diferente do treinamento, a inferência não possui gabarito1.
Fontes: Cloudflare, Hazelcast Foundations, DataCamp Blog
Large Language Models - LLM
Programa de AI treinado em um conjunto de dados massivo (centenas ou milhões de gigas) que são construídos através de machine learning, mais especificamente, por um tipo de rede neural (neural network) chamada transformer model e que possuem a capacidade de receber e gerar text.
Fontes: Cloudflare, YouTube, YouTube
Artificial Intelligence - AI
Artificial Intelligence é um conjunto de várias subáreas. A ideia é superar ou equiparar a capacidade de um ser humano em descobrir informações novas, inferir dados baseados em inputs e capacidade de ponderar cenários e resultados.
Fonte: Youtube
Machine Learning - ML
Uma das áreas da AI é o Machine Learning que se refere ao treinamento de programas através da ingestão de dados para identificar features sem intervenção humana direta no "como" identificar. Pode ser com supervisão humana para avaliar os resultados ou não.
Fonte: Youtube
Deep Learning e Neural Networks
Deep Learning é um tipo de ML que usa probabilidade e camadas para que o modelo se treine sem contato direto humano. Por sua vez, Neural Network é a arquitetura dos modelos que usam um sistema "parecido" com um cérebro humano.
Fontes: Cloudflare
AI vs AGI
Artificial General Intelligence (AGI) é um campo teórico de pesquisa que tem como objetivo criar software com capacidade de inteligência comparada à humana e capacidade de autoensino, basicamente, um programa que pode aprender qualquer coisa. AI já possui um escopo fechado onde os programas utilização restrições (como a quantidade de parâmetros) para resolver tarefas pré-definidas e que foram treinad.
Fontes: AWS - Artificial General Intelligence, Forbes - Difference Between AI and AGI
Footnotes
-
Nem sempre tem gabarito para os treinamentos também, vide aprendizado não supervisionado. ↩