Tencent Ciptakan Model AI Baru, Lebih Cepat dari Deepseek-R1 

Tencent kembali menarik perhatian dunia teknologi dengan merilis model kecerdasan buatan (AI) terbarunya yang diklaim lebih cepat dan lebih efisien dibandingkan dengan model Deepseek-R1 yang telah mendominasi pasar AI sebelumnya.  

Pengenalan Model AI Terbaru Tencent 

Pada 27 Februari 2025, Tencent mengumumkan peluncuran Hunyuan Turbo S, generasi terbaru dari model fast-thinking yang membawa terobosan besar dalam hal kecepatan respons dan optimalisasi performa model bahasa besar (LLM).  

Model AI ini diklaim mampu mengalahkan teknologi Deepseek-R1 dalam hal kecepatan dan performa. Dengan kemajuan pesat dalam bidang AI, peluncuran ini tidak hanya menjadi sorotan di industri teknologi, tetapi juga bisa mengguncang pasar global. 

Berbeda dengan model slow-thinking tradisional seperti Deepseek R1 dan Hunyuan T1, Hunyuan Turbo S menawarkan kemampuan untuk memberikan “jawaban instan”, meningkatkan kecepatan output kata hingga dua kali lipat dan mengurangi latensi untuk kata pertama sebesar 44%. Inovasi ini memberikan solusi baru bagi kebutuhan respons cepat dalam penerapan model bahasa besar. 

Menurut aibase, desain Hunyuan Turbo S terinspirasi oleh cara berpikir cepat manusia, yang mendominasi 90%-95% keputusan sehari-hari yang bersifat intuitif. Dengan memadukan mode berpikir cepat ini dengan pendekatan analisis rasional dalam slow-thinking, model ini menawarkan kemampuan pemecahan masalah yang lebih canggih dan efisien. 

Dalam berbagai uji coba benchmark publik yang umum digunakan, Hunyuan Turbo S menunjukkan performa yang sebanding dengan model-model terkemuka seperti DeepSeek V3, GPT-4, dan Claude. 

Baca juga : Kolaborasi Tencent dan DeepSeek: Hadirkan Layanan Pesan Cerdas Berbasis AI

Inovasi Arsitektur dengan teknologi Hybrid-Mamba-Transformer

Dari segi arsitektur, Hunyuan Turbo S mengintegrasikan mode Hybrid-Mamba-Transformer fusion, yang secara efisien mengurangi kompleksitas komputasi dan penggunaan cache KV-Cache pada arsitektur Transformer tradisional.  

“Hybrid-Mamba-Transformer Fusion adalah pendekatan arsitektur yang menggabungkan keunggulan dua teknologi: Mamba, yang efisien dalam mengolah teks panjang, dan Transformer, yang unggul dalam memahami konteks kompleks. Dengan mengintegrasikan kedua arsitektur ini, Hunyuan Turbo S dapat mengurangi penggunaan sumber daya dan memori, sekaligus mempertahankan performa tinggi dalam pemrosesan teks yang panjang dan pemahaman konteks yang mendalam. Pendekatan ini memungkinkan model untuk lebih efisien dalam pelatihan dan inferensi tanpa mengorbankan kualitas hasil. 

Pendekatan ini memungkinkan pengurangan biaya dalam pelatihan dan inferensi secara signifikan. 

Inovasi utama dari pendekatan hybrid ini mencakup: 

  • Menanggulangi tantangan biaya tinggi dalam pelatihan dan inferensi untuk model besar dengan teks panjang. 
  • Mengoptimalkan keunggulan arsitektur Mamba dalam menangani sekuens panjang. 
  • Mempertahankan keunggulan Transformer dalam memahami konteks yang kompleks. 
  • Menjadi model MoE (Mixture of Experts) ultra-besar pertama yang berhasil mengadopsi arsitektur Mamba tanpa mengorbankan performa. 
Hunyuan dan Integrasi Masa Depan

Sebagai inti dari rangkaian Tencent, Hunyuan Turbo S akan menjadi dasar pengembangan model-model turunan dalam bidang inferensi, teks panjang, dan pemrograman kode. Berdasarkan teknologi ini, Tencent juga merilis model inferensi T1, yang dilengkapi dengan kemampuan berpikir mendalam (deep thinking). 

Hunyuan Turbo S kini telah tersedia di Tencent Yuanbao dan akan segera dapat diakses melalui API. 

Ketersediaan dan Harga

Pengembang dan perusahaan dapat mengakses Hunyuan Turbo S melalui API di situs Tencent Cloud, dengan penawaran uji coba gratis selama satu minggu. 

Biaya penggunaan API ini adalah 0,8 yuan per juta token untuk input dan 2 yuan per juta token untuk output, yang menunjukkan penurunan harga signifikan dibandingkan model generasi sebelumnya. 

Selain itu, Hunyuan Turbo S juga akan tersedia secara bertahap di Tencent Yuanbao, di mana pengguna dapat memilih model Hunyuan dan menonaktifkan fungsi deep thinking untuk mencoba mode fast-thinking secara langsung. 

Untuk konsultasi lebih lanjut terkait dengan API Model Hunyuan Turbo, Anda dapat mengunjungi: disini.

Customer service

Jika Anda Tertarik dengan Layanan Kami

Silakan hubungi kami atau isi formulir di bawah ini dan kami akan menghubungi Anda sesegera mungkin.

Cloudflare form – ID

Pengalaman Luar Biasa menanti Anda!

Tertarik dengan layanan kami? Silahkan kontak kami! Tim kami akan segera menghubungi anda dan menyediakan solusi yang optimal untuk setiap kebutuhan anda

Kontak kami
×