AzEnRu
  • İNSTİTUT HAQQINDA
    • Ümumi məlumat
    • Rəhbərlik
    • Struktur
    • İctimai təşkilatlar
    • Alimlər
  • XƏBƏRLƏR
    • Bütün xəbərlər
    • Mühüm xəbərlər
    • Tədbirlər
    • Elanlar
    • Xarici əlaqələr və Əməkdaşlıq
    • Nəşr fəaliyyəti
    • Maraqlı məlumatlar
  • ELMİ FƏALİYYƏT
    • Elmi istiqamətlər
    • Elmi nəticələr
    • Elmi şuranın tərkibi
    • Elmi şuranın iclasları
    • İllik hesabat
  • ELMMETRİYA
  • DİSSERTASİYA ŞURASI
    • Doktorantura
    • Dissertasiya şurasının tərkibi
    • Dissertasiya şurasının iclasları
    • Qayda və təlimat
    • Dissertasiyaların avtoreferatları
  • İNNOVASİYA FƏALİYYƏTİ
    • Potensial tətbiqi layihələr
    • Yaradılan cihazlar
    • Tətbiq işləri
    • Patentlər
    • Qrantlar
  • NƏŞRLƏR
    • AMEA-nın Xəbərləri
    • Dəsrlik və Monoqrafiyalar
  • ƏLAQƏ
ANA SƏHİFƏ →XƏBƏRLƏR
+A -A

Google Gemini 2.5 dialoqlarda emosiyaları ötürməyi öyrənib

10.06.2025 / Maraqlı məlumatlar

Google I/O 2025 konfransında şirkət öz multimodal modeli olan Gemini 2.5-in yeni versiyasını təqdim etdi. Bu versiya artıq real vaxtda audio və dialoq generasiyasını dəstəkləyir. Sözügedən imkanlar Google AI Studio və Vertex AI platformaları vasitəsilə proqramçılar üçün ilkin sınaq versiyasında əlçatandır. Gemini 2.5 Flash Preview modeli süni zəka ilə səsli qarşılıqlı əlaqəni daha real edir. O, danışığın emosional tonunu tanıya, intonasiyanı və aksenti uyğunlaşdıra bilir, həmçinin 24-dən çox dil arasında keçid etməyə imkan verir.

Model fon səslərini nəzərə almadan danışığı emal edə bilir və dialoq zamanı aktual məlumat almaq üçün Google Search kimi xarici alətlərdən istifadə edə bilir. Əlavə olaraq, Gemini 2.5 nitqin sintezi (TTS) sahəsində genişləndirilmiş funksiyalar təqdim edir - səsləndirmənin üslubu, tempi və emosional ifadəliliyi üzərində idarəetməyə imkan verir. Bir neçə səsdən ibarət dialoqların generasiyası da dəstəklənir, bu isə modeli podkastlar, audio kitablar və digər multimedia məhsullarının yaradılması üçün uyğun edir.
Şəffaflığın təmin edilməsi məqsədilə, model tərəfindən yaradılan bütün audio materiallar SynthID texnologiyası ilə işarələnir. Bu da həmin məzmunların süni zəka tərəfindən generasiya edildiyini müəyyən etməyə imkan verir. Proqramçılar Google AI Studio platformasında Stream və Generate Media bölmələri vasitəsilə bu yeni funksiyaları sınaqdan keçirə bilərlər. Gemini 2.5 multimodal süni zəka sistemləri sahəsində əhəmiyyətli bir irəliləyiş nümayiş etdirir - mətn, foto, audio və videonu vahid platformada birləşdirir. Yeni funksiyalar interaktiv tətbiqlər, virtual assistentlər və təhsil sahəsində innovasiyaların yaradılması üçün geniş imkanlar açır.

technote.az

Tweet
ELANLAR
  • 26.08.2025
    “Kibernetika və İnformatikanın Problemləri” mövzusunda 6-cı beynəlxalq konfrans (PCI 2025) keçiriləcək
  • 30.06.2025
    ED 1.20 Dissertasiya şurasının iclasında dissertasiya işinin müdafiəsi keçiriləcək
  • 30.06.2025
    ED 1.20 Dissertasiya şurasının iclasında dissertasiya işinin müdafiəsi keçiriləcək
  • 30.05.2025
    ED 1.20 Dissertasiya şurasının iclasında dissertasiya işinin müdafiəsi keçiriləcək
Akademik Telman Əliyev
www.telmanaliev.az
HORIZON EUROPE
AR Elm və Təhsil Nazirliyi
İdarəetmə Sistemləri İnstitutu
Avropa İttifaqının
HORIZON EUROPE proqramının
Rəqəmsal, Sənaye və Kosmos istiqaməti üzrə dayaq nöqtəsidir
DÖVRİ NƏŞR
  • İNSTİTUT HAQQINDA
    • Ümumi məlumat
    • Rəhbərlik
    • İctimai təşkilatlar
    • Struktur
  • ELMİ FƏALİYYƏT
    • Elmi istiqamətlər
    • Elmi nəticələr
    • Doktorantura
    • Magistratura
  • İNNOVASİYA FƏALİYYƏTİ
    • Potensial tətbiqi layihələr
    • Tətbiq işləri
    • Patentlər
    • Qrantlar
  • XƏBƏRLƏR
    • Konfranslar, İclaslar
    • Mühüm xəbərlər
  • FAYDALI KEÇİDLƏR
    • Elanlar
    • Yeni nəşrlər
    • Linklər
Copyright © 2010-2025 İdarəetmə Sistemləri İnstitutu
Saytın xəritəsi