Artificial Analysis

Artificial Analysis är en tjänst som erbjuder objektiva benchmarking och information för att stödja beslutsfattare inom AI-modeller att välja lämplig modell och hostingtjänst baserat på kvalitet och hastighet.

En analys av olika modeller och leverantörer inom artificiell intelligens visar att OpenAI:s GPT-4 leder i kvalitetsmätningar. Andra modeller som Gemini Pro och Mixtral 8x7B har dock nått prestanda jämförbar med GPT-3.5 på vissa områden.

De främsta modellerna som jämförs är:

  • GPT-4 från OpenAI
  • GPT-4 Turbo från OpenAI
  • GPT-3.5 Turbo från OpenAI
  • Claude 2.0
  • Gemini Pro
  • Mixtral 8x7B Instruct
  • Llama 2 Chat (70B)
  • Mistral Medium
  • Mistral 7B Instruct
Artificial Analysis - De främsta modellerna

Dessa modeller utvärderas över olika mätningar för att bedöma deras förmåga inom generell förmåga, resonemang & kunskap samt kodning.

Leave a Reply

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *