Inovasi format data DeepSeek memberikan harapan segar bagi penggemar sirkuit AI lokal tentang lebih banyak perubahan besar

Pengembangan bertahap DeepSeek sangat signifikan karena telah menciptakan jalur baru bagi Tiongkok untuk mencapai keunggulan dalam AI

DeepSeek, startup kecerdasan buatan berbasis Hangzhou, mungkin telah membuat terobosan lain yang dapat mengganggu cara model AI dilatih di Tiongkok.

Format data inovatifnya, UE8M0 FP8, bisa membuka jalan bagi unit pemrosesan grafis (GPU) buatan sendiri untuk digunakan dalam melatih model yang kuat, meskipun GPU lokal tidak sekuat Nvidia.

Investor pasar saham Tiongkok antusias dengan terobosan tersebut, menyalurkan dana ke pengembang GPU lokal seperti Cambricon Technologies, sebuah perusahaan startup berbasis Beijing yang memiliki potensi untuk bersaing dengan Nvidia di pasar Tiongkok.

Apakah Anda memiliki pertanyaan tentang topik dan tren terbesar dari seluruh dunia? Dapatkan jawabannya denganPengetahuan SCMP, platform kami yang baru berisi konten yang telah dipilih dengan penjelasan, FAQ, analisis, dan infografis yang disajikan oleh tim kami yang memenangkan penghargaan.

Saham perusahaan yang terdaftar di Shanghaitelah meningkat dua kali lipat dalam sebulan terakhir, dengan kenaikan 20 persen dalam satu hari pada Jumat lalu dan kenaikan lainnya sebesar 11 persen pada Senin setelah pernyataan DeepSeek minggu lalu bahwa mereka telah mengubah format data untuk sesuai dengan “chip buatan sendiri generasi berikutnya yang akan segera dirilis”

Keributan itu mirip dengan bulan Januari ketika DeepSeek menggegerkan pasar saham AS. Perusahaan yang tidak dikenal ini, yang kantornya berada di menara perkantoran komersial yang melayani bank dan lembaga investasi, dianggap sebagai “kuda hitam terbesar” dalam lingkungan AI Tiongkok setelah meluncurkan model V3 pada Desember tahun lalu dan model R1 pada Januari. Dua model tersebut sejajar dengan yang terbaik di dunia dalam hal kinerja, tetapi dikembangkan dengan biaya yang jauh lebih rendah.

Untuk model bahasa besar V3-nya, DeepSeek mengatakan bahwa mereka hanya menggunakan 2.048 GPU Nvidia H800 dan itutotal biaya pelatihan adalah 5,6 juta dolar AS.

Chip H800 awalnya dibuat khusus untuk pasar Tiongkok agar sesuai dengan pembatasan ekspor AS, tetapi kemudian dibatasi oleh Washington pada tahun 2023 di bawah peraturan AS yang lebih ketat.

Model reasoning open-source DeepSeek-R1 telah menunjukkan kemampuan yang setara dengan o1 perusahaan startup AS OpenAI, tetapi juga dengan biaya pelatihan yang jauh lebih rendah. Kertas teknis yang diterbitkan DeepSeek mengenai R1 tidak menyebutkan biaya pengembangan.

Berita tersebut menyebabkan harga saham Nvidia turun 17 persen pada 27 Januari. Namun, keterkejutan ini ternyata bersifat sementara dan Nvidia telah memulihkan tanah yang hilang dan bahkan lebih banyak lagi, dengan sahamnya naik 50 persen dibandingkan tanggal 27 Januari.

Secara serupa, itu adalah langkah iman untuk percaya bahwa perubahan teknis dalam cara data diformat dalam pembelajaran mesin bisa segera melihat munculnya sistem perangkat keras AI sendiri Tiongkok dan berakhirnya dominasi perangkat keras AS dalam AI.

Namun, kemajuan bertahap DeepSeek tetap signifikan karena telah menciptakan jalur baru bagi Tiongkok untuk mencapai keunggulan AI. Dalam pemikiran konvensional, pelatihan model AI yang kuat membutuhkan chip AI terbaik, pasokannya didominasi oleh Nvidia dan tersedia dengan pertimbangan pemerintah Amerika Serikat. Artinya Tiongkok selalu berada dalam posisi yang tidak diuntungkan karena kurangnya akses terhadap chip terbaik dan peralatan yang diperlukan untuk membuat chip canggih.

Namun, seperti yang diungkapkan oleh pendiri Huawei Technologies Ren Zhengfei dalam wawancara terbaru dengan People’s Daily, meskipun chip AI buatan Tiongkok tertinggal setidaknya satu generasi dibandingkan Amerika Serikat, negara tersebut dapat mencapai daya komputasi dan efisiensi pelatihan yang serupa dengan memanfaatkan sinergi antara perangkat keras dan perangkat lunak. Pengekangan AI mungkin agak kaku, tetapi akan cukup untuk pekerjaan tersebut.

Pengungkapan DeepSeek mengenai inovasi format data mereka juga menunjukkan bahwa perusahaan ini lebih dari sekadar entitas komersial yang berorientasi pada keuntungan. Lebih seperti organisasi nirlaba yang mengejar misi yang lebih penting daripada keuntungan atau valuasi pasar.

Sementara pendiri OpenAI Sam Altman terus-menerus menghadapi tekanan untuk menghadirkan model baru dan mempromosikan penawaran baru agar membenarkan valuasi perusahaan,Pendiri DeepSeek Liang Wenfengbertindak lebih seperti seorang kepala laboratorium yang mengejar tujuan pembelajaran mesin yang efisien dan terjangkau untuk mencapai kecerdasan buatan umum.

Dalam hal ini, meskipun DeepSeek telah mengecewakan beberapa orang dengan tidak merilis model penalaran R2 yang lebih kuat seperti yang banyak diharapkan, signifikansi perusahaan bagi pengembangan kecerdasan buatan Tiongkok dan bahkan masa depan kecerdasan buatan dunia sebenarnya telah meningkat.

Artikel Lain dari SCMP

Di Singapura, video seorang insinyur memukul pekerja migran memicu perdebatan

Tiongkok menantang operasi kebebasan navigasi Amerika Serikat dengan mengatakan memiliki ‘tidak ada dasar hukum’

Ombudsman Hong Kong mendirikan akademi global untuk membantu melawan pemerintahan yang buruk

Trump, Lee dari Korea Selatan menekankan persamaan pandangan dalam pertemuan di Gedung Putih

Artikel ini pertama kali diterbitkan di South China Morning Post (www.scmp.com), media berita utama yang meliput Tiongkok dan Asia.

Hak Cipta (c) 2025. South China Morning Post Publishers Ltd. Seluruh hak cipta dilindungi.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top