
Jakarta – Komunitas artificial intelligence/AI (kecerdasan buatan) membicarakan DeepSeek R1 sebagai large language model AI asal China yang dibuat dengan biaya murah.
Kehadiran ini menandingi produk AI dari Amerika Serikat seperti ChatGPT o1 milik OpenAI.
“Ini bisa menjadi terobosan yang sangat bagus bagi para peneliti dan pengembang dengan sumber daya terbatas,” kata Asisten Profesor Sistem Informasi di Universitas Emory, Hancheng Cao,
Keberhasilan DeepSeek guna mengatasi kendala yang dihadapi perusahaan AI China terkait kontrol ekspor AS pada chip canggih.
Mantan karyawan DeepSeek, Zihan Wang membuat R1, DeepSeek harus mengurangi beban pada GPU. Jenis prosesor ini dirilis Nvidia untuk pasar China yang kinerjanya dibatasi hingga setengah kecepatan produk teratasnya.
DeepSeek R1 mampu menangani tugas penalaran rumit, khususnya dalam matematika dan pengodean. Model ini memakai pendekatan berjuluk ‘rantai pemikiran’ mirip dengan ChatGPT o1, memungkinkannya memecahkan masalah dengan memproses kueri langkah demi langkah.
Peneliti di laboratorium penelitian AI Frontiers Microsoft, Dimitris Papailiopoulos, mengemukakan R1 adalah kesederhanaan rekayasanya.
“DeepSeek bertujuan untuk jawaban yang akurat, secara signifikan mengurangi waktu komputasi sambil mempertahankan tingkat efektivitas tinggi,” katanya.
DeepSeek berbasis di Hangzhou berdiri pada Juli 2023 oleh Liang Wenfeng, alumni Universitas Zhejiang berlatar belakang di bidang informasi dan teknik elektronik.
Kemudian, Sam Altman dari OpenAI, Liang ingin membangun kecerdasan umum buatan (AGI), AI yang dapat menyamai atau bahkan mengalahkan kecerdasan manusia.
Liang memperoleh persediaan besar chip Nvidia A100, jenis ini dilarang diekspor ke China. Media China memperkirakan perusahaan tersebut memiliki 10.000 lebih stok, tapi Dylan Patel, pendiri SemiAnalysis, memperkirakan mereka punya setidaknya 50.000 unit.
Pelatihan AI adalah hal yang mendorong Liang untuk mendirikan DeepSeek, yang dapat menggunakannya dalam kombinasi dengan chip berdaya rendah untuk mengembangkan model AI.
Liang mengatakan tantangan tambahan yang dihadapi perusahaan China berupa sanksi chip adalah teknik rekayasa AI mereka cenderung kurang efisien.
“Kami harus mengonsumsi daya komputasi dua kali lipat untuk mencapai hasil yang sama. Tujuan kami adalah terus menutup kesenjangan ini,” katanya.
DeepSeek menemukan cara mengurangi penggunaan memori dan mempercepat perhitungan tanpa mengorbankan akurasi secara signifikan.
Namun, DeepSeek menemukan cara untuk mengurangi penggunaan memori dan mempercepat kalkulasi tanpa mengorbankan akurasi secara signifikan.
“Tim senang mengubah tantangan perangkat keras menjadi peluang untuk inovasi,” ucapnya. (adm)
Sumber: detik.com