Blog
Tecnologia
Fine-tuning: o processo de especializar e personalizar uma inteligência artificial

Tecnologia

Fine-tuning: o processo de especializar e personalizar uma inteligência artificial

Por: CWI

17/04/2024

4 minutos de leitura

Se você está pensando na necessidade de uma inteligência artificial personalizada para a sua empresa, o processo de fine-tuning (ajuste fino) é uma das opções que devem ser consideradas.

As definições dos dicionários de Cambridge e Merriam-Webster são um bom começo para entendermos o que o termo significa. “Fazer pequenas alterações em algo para que funcione da melhor maneira possível”, “ajustar com precisão para trazer ao mais alto nível de desempenho ou eficácia”.

No contexto de uma rede neural, é o que fazemos quando temos um modelo pré-treinado, como um Large Language Model (LLM), e queremos customizá-lo e especializá-lo de alguma forma.

O GPT, da OpenAI; o Gemini e o LaMDA, do Google; e o LLaMA, da Meta, são alguns dos LLMs existentes no mercado. Com a técnica de fine-tuning, podemos aproveitar tudo o que o GPT, por exemplo, já foi treinado para fazer e utilizá-lo para atender também demandas específicas da sua empresa, incluindo dados proprietários.

Continue a leitura para saber o que considerar na hora de decidir se esse é o processo mais indicado para o seu caso!

Quando optar por fine-tuning

O processo de ajuste fino em uma inteligência artificial envolve o treinamento de um modelo a partir de um conjunto de dados menor e mais específico para a realização de uma determinada tarefa. O resultado é uma IA sob medida para a necessidade de quem a utiliza.

De forma simplificada, temos três grandes etapas no fine-tuning. A primeira inclui a preparação e o upload dos dados de treinamento. A segunda, o treinamento do novo modelo ajustado. Por fim, é preciso fazer uma análise dos resultados e, se necessário, retornar à primeira etapa.

Essas etapas exigem um investimento financeiro, de tempo e de esforço que deve ser colocado na balança para comparação com outras soluções que melhoram o uso de Inteligência Artificial. É preciso considerar custos, qualidade e facilidade de uso, pensando também na qualidade dos dados que você tem à disposição para aperfeiçoar a IA.

A OpenAI, por exemplo, recomenda tentar melhorar as respostas obtidas com outras técnicas antes de optar pelo fine-tuning. A criadora do ChatGPT cita como sugestões….:

a engenharia de prompt,
o encadeamento de prompt (prompt chaining, quebrando tarefas complexas em vários prompts)
e a chamada de função (function calling).

Há ainda a técnica de Retrieval Augmented Generation (RAG). Se nem essa arquitetura e nem a otimização de prompt forem capazes de oferecer a solução necessária, cabe partir para o ajuste fino. Alguns casos citados pela OpenAI em que o fine-tuning pode melhorar os resultados são:

Definição de estilo, tom, formato ou outros aspectos qualitativos;
Melhoria da confiabilidade na produção do resultado desejado;
Correção de falhas para seguir instruções complexas;
Atividades que envolvem muitos casos extremos de formas específicas;
Execução de uma nova habilidade ou tarefa que seja difícil de articular rapidamente.

Situações que demandam dados em tempo real ou casos em que as informações mudam muito rápido, no entanto, não são sanados com o ajuste fino. Fazer o fine-tuning em um modelo é um processo que leva dias – quando finalizado, os dados já terão mudado e o modelo seguirá com um conhecimento defasado.

Entendendo a anatomia de uma rede neural

O fine-tuning é feito em algumas camadas da rede neural. O mais comum é ajustar as camadas mais profundas do modelo, mantendo as camadas iniciais fixas.

Isso porque as camadas iniciais são as que capturam recursos genéricos, como estruturas de frases em mais alto nível. Em geral, esse tipo de recurso é aproveitado do modelo original, sem atualização durante o treinamento. Quanto mais profunda a camada, mais específicos são os padrões capturados.

Para que os recursos já conhecidos não sofram alterações drásticas, uma possibilidade de estratégia para ajuste fino é trabalhar com uma taxa de aprendizagem mais baixa. Isso torna o processo mais estável, retendo as instruções anteriores.

Benefícios do processo de fine-tuning

É possível melhorar os retornos de modelos de IA incluindo instruções, exemplos e demonstrações de como executar uma tarefa em um prompt. Em outras palavras, com “aprendizagem rápida” (few-shot learning).

No entanto, conforme a OpenAI…:

“O ajuste fino melhora o aprendizado em poucas tentativas, treinando em muito mais exemplos do que cabem no prompt, permitindo que você obtenha melhores resultados em um amplo número de tarefas. Depois que um modelo tiver sido ajustado, você não precisará fornecer tantos exemplos no prompt. Isso economiza custos e permite solicitações de menor latência.”

Saiba mais sobre essas e outras vantagens do fine-tuning nos tópicos a seguir!

Maior precisão

Quando um LLM apresenta uma informação incorreta ou fictícia, dizemos que houve uma alucinação (hallucination). Nos casos em que há o processo de fine-tuning, a tendência é que o modelo responda com base nos dados utilizados no seu ajuste.

Economia de recursos

Na comparação com o investimento necessário para treinar uma rede neural do zero, o fine-tuning exige muito menos tempo e recursos computacionais. Além disso, no exemplo de ajuste fino do GPT, a OpenAI destaca a economia com tokens, devido aos prompts mais curtos.

Maior qualidade

A criadora do ChatGPT também destaca os resultados de maior qualidade como benefício do fine-tuning, comparando com o uso de prompts. Ainda cita que, com o ajuste fino, é possível treinar o modelo com mais exemplos do que cabem em um prompt, conforme mencionado anteriormente.

Maior agilidade

O incremento em agilidade se dá de duas formas. Uma delas é a já citada menor latência nas solicitações. Além disso, o próprio processo de treinamento é mais rápido. Afinal, os recursos fundamentais já estão compreendidos.

A CWI realiza ajustes finos para proporcionar os melhores resultados com ferramentas de inteligência artificial. Podemos integrar com os principais LLMs como serviço ou on-premise e fazer chaveamento entre modelos, decidindo qual é o mais aderente para resolver a demanda do seu negócio.

Conte conosco na sua evolução!

Referências

BOUCHARD, Louis-François. How to Improve your LLM? Find the Best & Cheapest Solution. Acesso em: 12 abr. 2024.

BUHL, Nikolaj. Training vs. Fine-tuning: What is the Difference? Acesso em: 10 abr. 2024.

FINE-TUNE. In: Merriam-Webster. Acesso em: 10 abr. 2024.

FINE-TUNING. In: Cambridge English Dictionary. Acesso em: 10 abr. 2024.

OPENAI. Fine-tuning. Acesso em: 09 abr. 2024.

SANTOS, André. IA Sob Medida: A Arte do Fine-Tuning em LLMs. Acesso em: 11 abr. 2024.

TORRES, Moisés Barrios. O que é o fine-tuning (ajuste fino) e como ele funciona nas redes neurais? Acesso em: 09 abr. 2024.

Compartilhe nas suas redes sociais

Fine-tuning: o processo de especializar e personalizar uma inteligência artificial

Quando optar por fine-tuning

Entendendo a anatomia de uma rede neural

Benefícios do processo de fine-tuning

Maior precisão

Economia de recursos

Maior qualidade

Maior agilidade

Outras publicações

Open Finance como estratégia para instituições financeiras

GHERKIN – Imperativo X Declarativo

Código que faz a diferença. Por que se preocupar com a eficiência dos algoritmos?