Apa itu DeepSeek AI? Adakah ia selamat? Berikut ialah semua yang anda perlu tahu


Adakah model permulaan China menggembirakan, mengganggu atau mengancam? Itu bergantung pada pandangan anda. Inilah yang pakar fikir anda perlu tahu.

Hanya beberapa minggu selepas kemasyhurannya yang baru ditemui, syarikat permulaan AI China DeepSeek bergerak pada kelajuan yang sangat tinggi, menumbangkan pesaing dan mencetuskan perbualan yang condong paksi tentang kebaikan perisian sumber terbuka.

Walau bagaimanapun, banyak kebimbangan keselamatan telah timbul mengenai syarikat itu, mendorong organisasi swasta dan kerajaan untuk mengharamkan penggunaan DeepSeek. Inilah yang anda perlu tahu.

Apa itu DeepSeek?

Diasaskan oleh Liang Wenfeng pada Mei 2023 (dan dengan itu belum berusia dua tahun), syarikat permulaan China itu telah mencabar syarikat AI yang mapan dengan pendekatan sumber terbukanya. Menurut Forbes, kelebihan DeepSeek mungkin terletak pada kenyataan bahawa ia hanya dibiayai oleh High-Flyer, dana lindung nilai yang juga dikendalikan oleh Wenfeng, yang memberikan syarikat model pembiayaan yang menyokong pertumbuhan dan penyelidikan yang pantas.

Permulaan itu membuat gelombang pada bulan Januariapabila ia mengeluarkan versi penuh R1, model penaakulan sumber terbukanya yang boleh mengatasi o1 OpenAI. Tidak lama selepas itu, muat turun App Store pembantu AI DeepSeek -- yang menjalankan V3, model DeepSeekdikeluarkan pada bulan Disember --mendahului ChatGPT, sebelum ini aplikasi percuma yang paling banyak dimuat turun. DeepSeek R1 malah naik ke tempat ketiga secara keseluruhan di Chatbot Arena HuggingFace, bertarung dengan beberapa model Gemini danChatGPT-4o; pada masa yang sama, DeepSeek mengeluarkan model imej baharu yang menjanjikan.

Keupayaan syarikat untuk mencipta model yang berjaya dengan mengoptimumkan cip lama secara strategik-- hasil daripada larangan eksport ke atas cip buatan AS, termasuk Nvidia -- dan mengedarkan beban pertanyaan merentas model untuk kecekapan adalah mengagumkan mengikut piawaian industri.

Apa itu DeepSeek R1?

Dikeluarkan sepenuhnya pada 21 Januari, R1 ialah model penaakulan utama DeepSeek, yang berprestasi pada atau melebihi model o1 OpenAI yang dipuji pada beberapa penanda aras matematik, pengekodan dan penaakulan.

Dibina di atas V3 dan berdasarkan Alibaba'Qwenand Meta'sLlama, apa yang menjadikan R1 menarik ialah, tidak seperti kebanyakan model teratas lain daripada gergasi teknologi, ia adalah sumber terbuka, bermakna sesiapa sahaja boleh memuat turun dan menggunakannya. Walau bagaimanapun, DeepSeek tidak mendedahkan set data latihan R1. Setakat ini, semua model lain yang telah dikeluarkannya juga merupakan sumber terbuka.

DeepSeek lebih murah daripada model AS yang setanding. Sebagai rujukan, akses API R1 bermula pada $0.14 untuk sejuta token, sebahagian kecil daripada $7.50 yang dikenakan oleh OpenAI untuk peringkat yang setara.

DeepSeek mendakwa dalam kertas penyelidikan syarikatbahawa model V3nya, yang boleh dibandingkan dengan model chatbot standard seperti Claude, menelan belanja $5.6 juta untuk dilatih, nombor yang diedarkan (dan dipertikaikan) sebagai keseluruhan kos pembangunan model tersebut. Seperti yang dilaporkan Reuters, beberapa pakar makmal percaya kertas kerja DeepSeek hanya merujuk kepada latihan akhir untuk V3, bukan keseluruhan kos pembangunannya (yang akan menjadi sebahagian kecil daripada apa yang telah dibelanjakan oleh gergasi teknologi untuk membina model kompetitif). Pakar lain mencadangkan kos DeepSeek tidak termasuk infrastruktur, R&D, data dan kos kakitangan terdahulu.

Satu kelemahan yang boleh memberi kesan kepada persaingan jangka panjang model dengan o1 dan alternatif buatan AS ialah penapisan. Model Cina sering menyertakan blok pada subjek tertentu, bermakna walaupun ia berfungsi setanding dengan model lain, mereka mungkin tidak menjawab beberapa pertanyaan (lihat bagaimana pembantu AI DeepSeek menjawab soalan tentang Dataran Tiananmen dan Taiwandi sini). Apabila penggunaan DeepSeek meningkat, ada yang bimbang pagar pengawal Cina yang ketat dan berat sebelah sistemik modelnya boleh tertanam merentas semua jenis infrastruktur.

Walau bagaimanapun, anda boleh mengakses versi platform DeepSeekthrough yang tidak ditapis dan berpangkalan di AS seperti Perplexity. Platform ini telah mengalih keluar pemberat penapisan DeepSeek dan menjalankannya pada pelayan tempatan untuk mengelakkan kebimbangan keselamatan.

Pada bulan Disember, keupayaan Tiernan RaycomparedR1-Lite dari ZDNET untuk menjelaskan rantaian pemikirannya kepada o1, dan hasilnya bercampur-campur. Walau bagaimanapun, pembantu AI DeepSeek mendedahkan pemikiran kepada pengguna semasa pertanyaan, pengalaman baru untuk ramai pengguna chatbot memandangkan ChatGPT tidak mengluarkan penaakulannya.

Sudah tentu, semua model popular datang dengan latar belakang pasukan merah, garis panduan komuniti dan pagar pembatas kandungan. Walau bagaimanapun, sekurang-kurangnya pada peringkat ini, chatbot buatan AS tidak mungkin mengelak daripada menjawab pertanyaan tentang peristiwa sejarah.

Apakah kebimbangan privasi dan keselamatan?

Kebimbangan privasi data yang telah beredar di TikTok -- aplikasi media sosial milik China yang kini agak diharamkan di AS -- juga timbul di sekitar DeepSeek.

Awal bulan ini, Ketua Pegawai Eksekutif Feroot Security Ivan Tsarynny memberitahu ABC bahawa firmanya telah menemui "pautan langsung ke pelayan dan syarikat di China yang berada di bawah kawalan kerajaan China," yang katanya mereka "tidak pernah melihat pada masa lalu."

Selepas menyahsulit beberapa kod DeepSeek, Feroot menemui pengaturcaraan tersembunyi yang boleh menghantar data pengguna -- termasuk mengenal pasti maklumat, pertanyaan dan aktiviti dalam talian -- kepada China Mobile, sebuah syarikat telekomunikasi yang dikendalikan oleh kerajaan China yang telah dilarang daripada beroperasi di AS sejak 2019 kerana kebimbangan keselamatan negara.

NowSecure kemudian mengesyorkanorganisasi "melarang" penggunaan aplikasi mudah alih DeepSeek selepas menemui beberapa kelemahan termasuk data yang tidak disulitkan (bermakna sesiapa yang memantau trafik boleh memintasnya) dan penyimpanan data yang lemah.

Minggu lalu, firma penyelidikan Wiz mendapati bahawa pangkalan data DeepSeek dalaman boleh diakses secara terbuka "dalam beberapa minit" selepas menjalankan pemeriksaan keselamatan. Pangkalan data "terbuka sepenuhnya dan tidak disahkan" mengandungi sejarah sembang, kunci API pengguna dan data sensitif lain.

"Lebih kritikal, pendedahan itu membenarkan kawalan pangkalan data penuh dan potensi peningkatan keistimewaan dalam persekitaran DeepSeek, tanpa sebarang pengesahan atau mekanisme pertahanan kepada dunia luar," jelas laporan Wiz.

Menurut Wired, yang pada mulanya menerbitkan penyelidikan itu, walaupun Wiz tidak menerima maklum balas daripada DeepSeek, pangkalan data itu nampaknya diturunkan dalam masa 30 minit selepas Wiz memberitahu syarikat itu. Tidak jelas berapa lama ia boleh diakses atau jika mana-mana entiti lain menemuinya sebelum ia diturunkan.

Walaupun tanpa perkembangan yang membimbangkan ini, dasar privasi DeepSeek menimbulkan beberapa bendera merah. Ia menyatakan, "Maklumat peribadi yang kami kumpulkan daripada anda mungkin disimpan pada pelayan yang terletak di luar negara tempat anda tinggal. Kami menyimpan maklumat yang kami kumpulkan dalam pelayan selamat yang terletak di Republik Rakyat China."

Dasar itu menggariskan bahawa DeepSeek mengumpul banyak maklumat, termasuk tetapi tidak terhad kepada:

  • Alamat IP, pengecam peranti unik dan kuki
  • Tarikh lahir (jika berkenaan), nama pengguna, alamat e-mel dan/atau nombor telefon, dan kata laluan
  • Input teks atau audio anda, gesaan, fail yang dimuat naik, maklum balas, sejarah sembang atau kandungan lain yang anda berikan kepada model dan perkhidmatan kami
  • Bukti identiti atau umur, maklum balas atau pertanyaan tentang penggunaan Perkhidmatan oleh anda [Jika anda menghubungi DeepSeek]

Dasar itu meneruskan: "Apabila kami memindahkan sebarang maklumat peribadi ke luar negara tempat anda tinggal, termasuk untuk satu atau lebih tujuan seperti yang dinyatakan dalam Dasar ini, kami akan berbuat demikian mengikut keperluan undang-undang perlindungan data yang berkenaan." Dasar ini tidak menyebut pematuhan GDPR.

"Pengguna perlu sedar bahawa sebarang data yang dikongsi dengan platform boleh tertakluk kepada akses kerajaan di bawah undang-undang keselamatan siber China, yang mewajibkan syarikat menyediakan akses kepada data atas permintaan oleh pihak berkuasa," kata Adrianus Warmenhoven, ahli lembaga penasihat keselamatan NordVPN, kepada ZDNET melalui e-mel.

Menurut beberapa pemerhati, hakikat bahawa R1 adalah sumber terbuka bermakna peningkatan ketelusan, membolehkan pengguna memeriksa kod sumber model untuk tanda-tanda aktiviti berkaitan privasi.

Walau bagaimanapun, DeepSeek juga mengeluarkan versi R1 yang lebih kecil, yang boleh dimuat turun dan dijalankan secara tempatan untuk mengelakkan sebarang kebimbangan tentang data yang dihantar kembali kepada syarikat (berbanding mengakses chatbot dalam talian).

Semua chatbots, termasuk ChatGPT, mengumpul beberapa tahap data pengguna apabila ditanya melalui penyemak imbas.

Adakah DeepSeek AI selamat?

Penyelidik keselamatan AI telah lama bimbang bahawa model sumber terbuka yang berkuasa boleh digunakan dengan cara yang berbahaya dan tidak terkawal sebaik sahaja keluar di alam liar. Ujian oleh firma keselamatan AI Chatterbox mendapati DeepSeek R1 mempunyai "isu keselamatan secara menyeluruh."

Pada tahap yang berbeza-beza, syarikat AI AS menggunakan beberapa jenis pasukan pengawasan keselamatan. DeepSeek tidak mendedahkan sama ada ia mempunyai pasukan penyelidik keselamatan, dan tidak menjawab permintaan ZDNET untuk mengulas mengenai perkara itu.

"Kebanyakan syarikat akan terus berlumba-lumba untuk membina AI terkuat yang mereka boleh, tanpa mengira risiko, dan akan melihat kecekapan algoritma yang dipertingkatkan sebagai cara untuk mencapai prestasi yang lebih tinggi dengan lebih cepat," kata Peter Slattery, seorang penyelidik di pasukan FutureTech MIT yang mengetuai projek Repositori Risikonya. "Itu menjadikan kami lebih sedikit masa untuk menangani cabaran keselamatan, tadbir urus dan masyarakat yang akan datang dengan sistem AI yang semakin maju."

"Kejayaan DeepSeek dalam kecekapan latihan juga bermakna kita tidak lama lagi akan menjangkakan untuk melihat sejumlah besar 'pembungkus' tempatan khusus -- aplikasi yang dibina di atas enjin DeepSeek R1 -- yang masing-masing akan memperkenalkan risiko privasi mereka sendiri, dan yang masing-masing boleh disalahgunakan jika mereka jatuh ke tangan yang salah," tambah Ryan Fedasiuk, pengarah tadbir urus AI AS di The Future Society, sebuah organisasi bukan untung dasar AI.

Adakah DeepSeek lebih cekap tenaga?

Sesetengah penganalisisambil perhatian bahawa model pengiraan lif rendah DeepSeek lebih cekap tenaga daripada gergasi AI binaan AS.

"Model AI baharu DeepSeek berkemungkinan menggunakan lebih sedikit tenaga untuk melatih dan menjalankan berbanding model pesaing yang lebih besar," kata Slattery. "Walau bagaimanapun, saya ragu-ragu ini menandakan permulaan trend jangka panjang dalam penggunaan tenaga yang lebih rendah. Kuasa AI berpunca daripada data, algoritma dan pengiraan -- yang bergantung pada cip yang sentiasa bertambah baik. Apabila pembangun sebelum ini telah menemui cara untuk menjadi lebih cekap, mereka biasanya telah melabur semula keuntungan tersebut untuk membuat model yang lebih besar dan lebih berkuasa, dan bukannya mengurangkan penggunaan tenaga keseluruhan."

"DeepSeek bukan satu-satunya syarikat AI yang telah memperoleh keuntungan luar biasa dalam kecekapan pengiraan. Dalam beberapa bulan kebelakangan ini, Anthropic dan Google Gemini yang berpangkalan di AS telah mempunyai peningkatan prestasi yang serupa," kata Fedasiuk.

"Pencapaian DeepSeek adalah luar biasa kerana mereka nampaknya mempunyai penemuan kejuruteraan bebas yang menjanjikan untuk menjadikan model bahasa besar jauh lebih cekap dan lebih murah, lebih awal daripada yang dijangkakan oleh ramai profesional industri -- tetapi dalam bidang yang dinamik seperti AI, sukar untuk meramalkan berapa lama syarikat itu akan dapat berjemur dalam tumpuan."

Bagaimanakah DeepSeek akan menjejaskan industri AI?

Kejayaan R1 menyerlahkan perubahan besar dalam AI yang boleh memperkasakan makmal dan penyelidik yang lebih kecil untuk mencipta model kompetitif dan mempelbagaikan pilihan. Sebagai contoh, organisasi tanpa pembiayaan atau kakitangan OpenAI boleh memuat turun R1 dan memperhalusinya untuk bersaing dengan model seperti o1. Sejurus sebelum keluaran R1, penyelidik di UC Berkeleymencipta model sumber terbuka setanding dengan o1-preview, versi awal o1, dalam masa 19 jam sahaja dan dengan harga kira-kira $450.

Memandangkan betapa terlalu tingginya pelaburan AI, ramai pakar membuat spekulasi bahawa perkembangan ini boleh memecahkan gelembung AI (pasaran saham pastinya panik). Ada yang melihat kejayaan DeepSeek sebagai membongkar pemikiran bahawa pembangunan canggih bermakna model dan perbelanjaan yang besar. Ia juga melemparkan Stargate, inisiatif infrastruktur bernilai $500 bilion yang diterajui oleh beberapa gergasi AI, dalam cahaya baharu, mewujudkan spekulasi sama ada AI yang kompetitif memerlukan tenaga dan skala pusat data yang dicadangkan oleh inisiatif itu.

Pendakian DeepSeek datang pada masa kritikal untuk hubungan teknologi Cina-Amerika, hanya beberapa hari selepas larangan TikTok yang telah lama diperjuangkan berkuat kuasa separa. Ironinya, DeepSeek membentangkan dalam bahasa mudah makanan untuk kebimbangan keselamatan yang AS bergelut untuk membuktikan tentang TikTok dalam usaha berpanjangan untuk menggubal larangan itu.

Negara manakah yang mengharamkan DeepSeek?

Beberapa agensi AS, termasuk NASA dan Tentera Laut, telah pun mengharamkan DeepSeek pada teknologi keluaran kerajaan pekerja, dan penggubal undang-undang cuba mengharamkan aplikasi itu daripada semua peranti kerajaan, yang telah dilaksanakan oleh Australia dan Taiwan. Korea Selatan telah mengharamkan muat turun baharu apl itu kerana kegagalan DeepSeek baru-baru ini untuk mematuhi perlindungan data tempatan. Itali sedang menyiasat syarikat itu kerana kebimbangan mengenai pematuhan GDPR.