MI jaunumi 2025.gada janvārī
Šajā rakstā apkopoti dažādi notikumi mākslīgā intelekta (MI) un mašīnmācīšanās jomā 2025.gada janvārī.
Drošība
- Publicēts starptautiskais MI drošības pārskats, kuras izstrādē ir piedalījušies 100 MI eksperti. Tajā ir apkopoti zinātniskie pierādījumi par vispārējas nozīmes (general-purpose) MI drošību, lai palīdzētu radīt kopīgu izpratni par MI radītajiem riskiem un to, kā tos mazināt.
- Pasaules Ekonomikas forums ir publicējis 2025. gada globālo risku pārskatu, kurā aplūko arī riskus, ko var radīt mākslīgais intelekts.
- Uzņēmums Resemble AI paziņoja, ka tas ir izveidojis dziļviltojumu incidentu datubāzi — https://www.resemble.ai/deepfake-database/
- Anthropic atbilstības pētniecības komanda (alignment science team) publicēja rakstu par drošības izpētes virzieniem mākslīgā intelekta (MI) jomā.
Raksts sniedz pārskatu par tehniskajiem pētniecības virzieniem MI drošības jomā, ko veic uzņēmums Anthropic un tas aicina MI pētniecības kopienai pievērsties šiem jautājumiem. Raksta mērķis ir identificēt konkrētus tehniskus risinājumus, kas varētu palīdzēt novērst katastrofālus nākotnes MI sistēmu riskus, piemēram, masveida cilvēku bojāeju vai cilvēku kontroles zaudēšanu pār MI.
Galvenie pētniecības virzieni ietver:
- MI spēju novērtēšana — izstrādāt precīzākas metodes MI sistēmu reālās ietekmes un attīstības trajektorijas novērtēšanai.
- MI saskaņotības novērtēšana — pētīt, cik lielā mērā MI darbojas atbilstoši vēlamajām vērtībām un drošības standartiem.
- MI domāšanas izpratne — analizēt, kā modeļi pieņem lēmumus un vai tie spēj slēpt savus patiesos nolūkus.
- MI kontrole un uzraudzība — metodes, kā nodrošināt MI darbības drošību, izmantojot uzvedības un aktivāciju monitoringu.
- Drošības uzraudzības mērogošana — stratēģijas, kā efektīvi pārraudzīt progresīvus MI modeļus pat tad, ja cilvēku uzraudzība kļūst neefektīva.
- MI godīguma nodrošināšana — pētījumi par to, kā atpazīt un veicināt modeļu godīgumu.
- Aizsardzība pret uzbrukumiem — stratēģijas, kā uzlabot MI sistēmu noturību pret ļaunprātīgiem izmantojumiem, piemēram, jailbreak uzbrukumiem.
- Bīstamas informācijas “aizmācīšana” (Unlearning dangerous information and capabilities) — metodes, kā padarīt MI nespējīgu izmantot kaitīgas zināšanas.
- Daudzu MI aģentu pārvaldība (Learned governance for multi-agent alignment) — koordinācijas problēmu risinājumi, kas var rasties, kad mijiedarbojas vairāki MI modeļi.
Raksts aicina MI pētniecības kopienu pievērsties šiem jautājumiem, lai nodrošinātu nākotnes MI sistēmu drošību un samazinātu iespējamos riskus.
Likumdošana
- ASV paziņoja, ka pastiprina ierobežojumus MI mikroshēmu eksportam uz daudzām valstīm. Ierobežojums neattiecas uz 18 valstīm (Austrāliju, Beļģiju, Dāniju, Dienvidkoreju, Franciju, Itāliju, Īriju, Japānu, Jaunzēlandi, Kanādu, Lielbritāniju, Nīderlandi, Norvēģiju, Spāniju, Somiju, Taivānu, Vāciju un Zviedriju), taču pārējām valstīm ir noteiktas mikroshēmu eksporta kvotas (tier 2), vai eksports ir aizliegts pilnībā (tier 3) — https://www.lsm.lv/raksts/zinas/ekonomika/16.01.2025-baltijas-valstis-kritize-asv-lemumu-ierobezot-maksliga-intelekta-mikroshemu-eksportu.a583959/
- ASV prezidents Donalds Tramps atsauca iepriekšējā prezidenta (Džo Baidena) rīkojumu nr. 14110 jeb rīkojumu par drošu un uzticamu mākslīgo intelektu — https://bidenwhitehouse.archives.gov/briefing-room/statements-releases/2023/10/30/fact-sheet-president-biden-issues-executive-order-on-safe-secure-and-trustworthy-artificial-intelligence/.
Notikumi
- No 7. līdz 10. janvārim Las Vegasā notika ikgadējā tehnoloģiju izstāde CES — https://www.ces.tech/
- 22.janvārī notika Cisco MI samits (Cisco AI summit) — https://www.ciscoaisummit.com/
Embedding modeļi
- Uzņēmums Voyage AI izveidojis jaunu embedding modeli: voyage-3-large
Modeļa parametri:
- konteksta logs: 32'000 tokenu [1],
- dimensijas: 1'024 (pēc noklusējuma), bet ir konfigurējams arī uz 256, 512 vai 2048 dimensijām [1],
- atbalstītās valodas (iekavās norādīts NDCG@10 rezultāts attiecīgai valodai voyage-3-large (int8, 1024) modelim): angļu, arābu (95.2%), bengāļu (83.0%), čehu (85.5%), dāņu (97.4%), itāļu (89.5%), japāņu (91.3%), korejiešu (94.7%), krievu (87.6%), franču (87.1%), grieķu (95.9%), gruzīnu (65.3%), nīderlandiešu (99.6%), norvēģu (99.7%), persiešu (99.2%), poļu (99.9%), portugāļu (97.4%), rumāņu (68.5%), slovāku (86.7%), spāņu (86.8%), taju (98.6%), turku (92.1%), ungāru (87.9%), urdu (97.9%), vācu (83.6%), vjetnamiešu (91.6%), zviedru (85.1%) [2].
[1] — “voyage-3-large: the new state-of-the-art general-purpose embedding model”: https://docs.voyageai.com/docs/embeddings
[2] —” [PUBLIC] Voyage AI voyage-3-large Evaluation Results”: https://docs.google.com/spreadsheets/d/1Su4k9pfLgKfLQCLlqz-SlW9aErEJXOPYZyhZ_XbViFI/edit?gid=502255687#gid=502255687
LLM modeļi
Skat. arī citas sadaļas (text-to-code, text-to-image u.c.).
- DeepSeek V3 modeļi pieejami HuggingFace platformā.
- LlamaIndex piedāvā jaunu modeli vdr-2b-multi-v1 — https://huggingface.co/blog/vdr-2b-multilingual — modelis paredzēts dokumentu apstrādei.
- jauns LLM modeļu TOPs — WeirdML — https://www.lesswrong.com/posts/LfQCzph7rc2vxpweS/introducing-the-weirdml-benchmarkLL
- Gemini lietotnē (Gemini app) pieejams jaunākais modelis Gemini 2.0 Flash — https://blog.google/feed/gemini-app-model-update-january-2025/.
- Uzņēmums Perplexity AI piedāvā maksas API risinājumu (sonar) — MI meklētājprogramma. Sīkāk par šo funkcionalitāti skat. šeit.
- Mistral AI piedāvā Predicted Outputs funkcionalitāti — https://docs.mistral.ai/capabilities/predicted-outputs/
Līdzīga funkcionalitāte: OpenAI Predicted Outputs.
Text-to-Code
- LMArena sadarbībā ar Together AI ir uzlabojuši tīmekļa izstrādes līdera topa sarakstu (WebDev Arena Leaderboard): https://web.lmarena.ai/leaderboard
- Programmēšanas uzdevumu tops SWE-bench papildināts ar jauniem modeļiem/aģentiem: https://x.com/OfirPress/status/1877079146771145032
- Uzņēmumam Mistral AI jauns modelis — Codestral 25.01 — https://mistral.ai/news/codestral-2501/ Pēc LMArena “Copilot Arena” topa, modelis, kopā ar Deepseek V2.5 un Claude 3.5 Sonnet modeļiem, ieņem 1.vietu:
Dokumentācija par Codestral (t.sk. integrācija ar dažādām platformām) ir pieejama šeit.
Text-to-Image (T2I)
- LMArena ir izveidojis jaunu text-to-image modeļu topu—https://lmarena.ai/ (skat. sadaļu “Leaderboard” -> “Text-to-Image”):
Citi T2I modeļu topi: Artificial Analysis, MJ-Bench.
- ByteDance SA2VA — https://bsky.app/profile/merve.bsky.social/post/3lfcmx3nc322q
- Alpha-VLLM (Ķīna) izlaidusi jaunu T2I modeli Lumina-Image-2.0
- Uzņēmums RenderNet papildinājis savu rīku ar Raw Photo Model for Flux funkcionalitāti— https://x.com/rendernet_ai/status/1877347971068735574
Attēlu modeļi
image-to-text (I2T), image-to-image (I2I), image-to-3D u.c.
- Uzņēmums M87 Labs izlaida jaunu atvērtā koda attēlu modeli (vision language model) Moondream 1.9B.
Šeit ir sīkāk aprakstītas modeļa iespējas. - Stability AI — Stable Point Aware 3D (SPAR3D) — izmantojot 2D objekta attēlu, izveido 3D punktu mākoni (point cloud) — https://stability.ai/news/stable-point-aware-3d
- Uzņēmums HuggingFace publicēja kodu, ko izmantoja, lai apmācītu SmolVLM — modelis, kurš var atbildēt uz jautājumiem par iedoto attēlu.
Video modeļi/rīki
text-to-video (T2V), video-to-video (V2V) u.c.
- Hailuo AI jauns modelis — S2V-01: https://www.minimaxi.com/en/news/s2v-01-release
- NVIDIA CES pasākuma laikā paziņoja par Cosmos — tā platforma ģeneratīviem MI modeļiem.
- Video un attēlu ģenerēšanas platformai Kling jaunāka versija (1.6) — https://www.klingai.com/release-notes
- Uzņēmums ByteDance izlaida LatentSync — lip sync satvars (framework)
- Uzņēmums Runway 2024.gada jūnijā izlaida video ģenerēšanas modeli Gen3. Maksas pakalpojumā (Gen-3 Alpha modelis) no janvāra ir iespējams video pārveidot 4K izšķirtspējā — https://x.com/CharaspowerAI/status/1877357019515998642
- Jauna metode TransPixeler (iepriekš: TransPixar) priekš text-to-video modeļiem, kas tiem piešķir RGBA video ģenerēšanas spējas (resp., ietver arī alfa kanālu caurspīdīgumam) — https://github.com/wileewang/TransPixar
- Uzņēmums Replicate kopš janvāra savā Playground rīkā piedāvā arī AI video ģenerēšanu — https://replicate.com/blog/generate-videos-with-playground
- Netflix Eyeline Studios izstrādājis modeli Go-with-the-Flow — https://github.com/Eyeline-Research/Go-with-the-Flow
MI aģenti, RAG
- Uzņēmums Galileo Technologies Inc izdeva e-grāmatu par MI aģentiem — https://www.galileo.ai/ty/ebook-mastering-agents
- LlamaIndex piedāvā Agentic Document Workflows (ADW) —MI aģentu risinājumu dokumentu apstrādei — https://www.llamaindex.ai/blog/introducing-agentic-document-workflows
- Dienvidkorejas augstskola KAIST AI kopā ar DeepAuto izveidojuši videoRAG —”VideoRAG: Retrieval-Augmented Generation over Video Corpus”
- ByteDance: UI-TARS — https://x.com/ai_for_success/status/1881938011426086986
- Uzņēmums OpenAI izstrādājis jaunu rīku: Operator — tas ir MI aģents, kurš pēc lietotāja komandas spēj pārlūkot internetu. Rīks šobrīd pieejams tikai ASV, Pro plāna lietotājiem.
Alternatīvi rīki: Computer Use (Anthropic), Open Operator (Browserbase), Browser Use, UI-TARS Desktop (ByteDance).
- Goose — jauns atvērtā tipa MI aģents — https://block.github.io/goose/blog/2025/01/28/introducing-codename-goose
- Anthropic jaunākajiem modeļiem pieejama Citations funkcionalitāte — tā dod iespēju modelim citēt atgrieztā rezultāta tekstu.
Sīkāk par šo funkcionalitāti var iepazīties šeit. - ASV universitāte un Alibaba Group ir izveidojuši multi-aģentu satvaru (framework) — Mobile-Agent-E: https://x-plug.github.io/MobileAgent/
- Pig — aģents Windows lietotņu automatizācijai.
Rīki
- Google AI Studio atbalsta PWA (progressive web app) funkcionalitāti — https://www.linkedin.com/posts/logankilpatrick_we-just-shipped-google-ai-studio-as-a-progressive-activity-7282421987849748481-3FaW/
- Jauns tērzētavas rīks — https://chat.qwenlm.ai/
- Jauna darba sludinājumu platforma MI jomā — https://www.langjobs.dev/
- Google eksperimentāls rīks Daily Listen (pieejams tikai ASV) — https://labs.google.com/search/experiment/20?eep=googlelabs
- OpenAI rīkā papildu funkcionalitāte: Tasks — https://help.openai.com/en/articles/10291617-scheduled-tasks-in-chatgpt — iespēja rīkam norādīt, lai tas atgādina vai apkopo lietotājam interesējošās lietas.
- Jauns kodēšanas asistents: Trae —https://www.trae.ai/
- LangGraph Functional API — https://blog.langchain.dev/introducing-the-langgraph-functional-api/ — alternatīvs risinājums kā veidot MI darbplūsmas (workflows), izmantojot LangGraph funkcijas.
Izglītība
- Pilotprogramma Nigērijā, kurā tika noskaidrots vai MI var palīdzēt bērniem ātrāk apgūt zināšanas — https://www.psychologytoday.com/us/blog/the-digital-self/202501/can-ai-condense-two-years-of-learning-into-six-weeks
- Bezpeļņas MI izpētes institūts Ai2 izlaida eksperimentālu rīku ScholarQA, kas dod iespēju uzdot jautājumus par zinātniskajiem rakstiem.
Sports
- Formula E un Google Cloud paziņo par partnerību. Šīs sadarbības galvenie virzieni:
- Snieguma uzlabošana ar mākslīgo intelektu — izmantojot Google Cloud Vertex AI un Gemini modeļus braucēju snieguma analīzei, sniedzot personalizētus ieteikumus un reāllaika atgriezenisko saiti.
- Līdzjutēju iesaistes padziļināšana — izmantojot BigQuery platformu, lai radītu personalizētu skatītāju pieredzi un detalizētākas sacīkšu prognozes TV.
- Kiberdrošības uzlabošana — nodrošinot augsta līmeņa drošības pasākumus Formula E datiem.
Papildus tiks paplašināts GENBETA projekts, kurā abas organizācijas turpinās attīstīt drošību, sniegumu un inovācijas autosportā.
Neražas
- Uzņēmuma Cognition izveidotais MI programmēšanas inženieris Devins kādam uzņēmumam radīja papildu $733 izmaksas — https://x.com/abhagsain/status/1876362355870994538.
Ņemot vērā ažiotāžu, izmaksas tomēr kompensēja PostHog un Cognition, bet visvērtīgākā atziņa, ko šis uzņēmējs guva — ir vairākas reizes jāpārskata MI ģenerētais kods pirms tas tiek laists produkcijā. - Lai gan DeepSeek uzņēmuma izstrādātais atvērtā tipa modelis DeepSeek-R1 ir viens no labākajiem MI nozarē, daudzi DeepSeek tērzētavas lietotāji ir pamanījuši, ka tas cenzē atsevišķu saturu. Īpaši tas nevēlas neko atbildēt par 1989. gada slaktiņu Tiaņaņmeņas laukumā (daži piemēri: The Guardian, Sherwood, Promtfoo, KyleJGlen, Luiza Jarovsky u.c.).
- DeepSeek bija saskāries ar vēl vienu citu problēmu — uzņēmums Wiz Research atklāja datu noplūdi tērzētavas datos. Sīkāk skat. šeit.
Dažādi
- SoftBank, OpenAI, Oracle un MGX plāno izveidot Stargate uzņēmumu un tajā 4 gadu laikā investēt 500 mljrd. USD — https://openai.com/index/announcing-the-stargate-project/