Apa Itu AI Open Source? Penjelasan Lengkap

Oleh: Hobon.id (12/05/2026)

Pembicaraan tentang artificial intelligence saat ini tidak dapat dipisahkan dari pembicaraan tentang siapa yang mengendalikannya. Setiap pertanyaan besar dalam kebijakan, teknologi, dan etika AI pada akhirnya kembali pada pilihan mendasar, yaitu haruskah sistem AI yang paling canggih dikembangkan, dimiliki, dan dikendalikan oleh sejumlah kecil perusahaan teknologi, atau haruskah sistem tersebut dibangun secara terbuka — dengan arsitektur, bobot, dan datanya tersedia bagi siapa pun yang ingin mempelajari, memodifikasi, atau membangunnya?

Pertanyaan itulah yang menjadi inti dari AI open source — dan jawabannya jauh lebih diperdebatkan, bernuansa, dan berdampak besar daripada yang mungkin terlihat pada awalnya.

Advertisement:

Dari Software Open Source ke AI Open Source

Untuk memahami apa itu AI open source, kita perlu terlebih dahulu memahami apa itu software open source dan mengapa hal itu sangat penting sebelum AI menjadi percakapan teknologi yang dominan.

Open source software (OSS) adalah kode sumber yang dapat diakses publik yang dapat diperiksa, dimodifikasi, dan ditingkatkan oleh siapa pun. Sejak tahun 1980-an, open source telah berkembang dari gerakan akar rumput menjadi penggerak penting inovasi teknologi dan sosial. Gagasan untuk membuat kode sumber perangkat lunak tersedia secara bebas bagi siapa pun untuk dilihat, dimodifikasi, dan didistribusikan secara komprehensif telah mengubah industri perangkat lunak global. Tetapi hal itu juga berfungsi sebagai model baru yang ampuh untuk kolaborasi dan inovasi di domain lain.

Landasan filosofisnya berasal dari Richard Stallman dan Free Software Foundation, yang didirikan pada tahun 1985, yang berpendapat bahwa kebebasan perangkat lunak — hak untuk menjalankan, mempelajari, memodifikasi, dan mendistribusikan program — adalah keharusan etis. Gerakan open source yang lebih pragmatis yang muncul kemudian kurang berfokus pada etika dan lebih pada manfaat praktis dari pengembangan kolaboratif, yaitu lebih banyak kontributor menemukan lebih banyak bug, lebih banyak orang menguji kasus-kasus ekstrem, dan infrastruktur bersama yang tidak dapat dibangun oleh satu organisasi saja. Total biaya untuk memproduksi perangkat lunak open source di dunia diperkirakan mencapai $4,15 miliar oleh para peneliti di Harvard dan Universitas Toronto, sementara nilai yang diciptakan jauh lebih besar: $8,8 triliun.

AI open source menerapkan prinsip-prinsip yang sama — penggunaan, studi, modifikasi, dan distribusi gratis — pada sistem AI. AI open source mengambil ide-ide di balik pengembangan perangkat lunak open source dan menerapkannya pada bidang AI dan machine learning. Ini mempercepat pengembangan solusi AI di bidang-bidang seperti pemrosesan bahasa alami, pengenalan gambar, dan analisis sentimen melalui iterasi cepat, tinjauan sejawat, dan pemecahan masalah bersama. Dan ini mendorong transparansi dalam pengembangan AI, sehingga faktor penting dalam membangun sistem AI yang dapat dipercaya dan etis.

Sejarah AI open source mencerminkan sejarah pengembangan AI yang lebih luas. OpenCV dirilis pada tahun 2000 dengan algoritma AI tradisional. Kerangka kerja pembelajaran mendalam seperti Torch dan TensorFlow membawa alat sumber terbuka ke era machine learning. Rilis publik AlexNet pada tahun 2012 memicu revolusi pembelajaran mendalam yang mengikutinya. OpenAI didirikan pada tahun 2015 dengan misi eksplisit untuk menciptakan artificial intelligence open source yang bermanfaat bagi umat manusia. GPT-1 dirilis pada tahun 2018. Pengumuman GPT-2 pada tahun 2019 merupakan titik balik — OpenAI awalnya berencana untuk merahasiakan model tersebut, dengan alasan kekhawatiran tentang aplikasi berbahaya, tetapi setelah mendapat kecaman publik, mereka merilisnya ke GitHub tiga bulan kemudian.

Momen penting baru-baru ini terjadi pada Januari 2025, ketika perusahaan AI Tiongkok DeepSeek merilis model AI generatif R1 sumber terbukanya, yang memicu gempa geopolitik dalam kebijakan AI. Rilis tersebut menunjukkan bahwa sebuah perusahaan Tiongkok dapat menyamai kinerja model-model terdepan OpenAI dengan menggunakan prinsip-prinsip open source dan secara dramatis menurunkan biaya komputasi — dan bahwa AI open source telah menjadi bagian dari persaingan geopolitik AS-Tiongkok, sehingga menimbulkan kekhawatiran tentang privasi data, sensor, dan keamanan nasional yang belum sepenuhnya diantisipasi oleh pemerintah di seluruh dunia.

Masalah Definisi: Apa yang Dianggap sebagai AI "Open Source"?

Salah satu masalah yang paling penting secara praktis dalam AI open source adalah definisi — dan definisi ini sangat penting karena menentukan kewajiban apa yang dimiliki perusahaan, kebebasan apa yang dimiliki pengguna, perlakuan regulasi apa yang berlaku, dan kepercayaan apa yang diberikan ekosistem kepada berbagai rilis.

Meskipun belum ada konsensus tentang definisi apa yang termasuk "AI open source," Open Source Initiative (OSI) — yang memelihara "Definisi Open Source" yang otoritatif untuk perangkat lunak dan daftar lisensi yang disetujui — telah mendorong proses multi-pemangku kepentingan untuk mendefinisikan apa arti AI open source. Tantangannya adalah bahwa model AI pada dasarnya lebih kompleks daripada program perangkat lunak, dan komponen yang paling penting berbeda dari komponen yang mendefinisikan keterbukaan perangkat lunak.

Untuk perangkat lunak, open source berarti akses ke kode sumber — instruksi yang dapat dibaca manusia yang ditulis oleh seorang programmer. Untuk AI, kode sumber kerangka kerja pelatihan hanyalah satu komponen. Bobot model — miliaran parameter numerik yang mengkodekan apa yang telah dipelajari model — bisa dibilang lebih penting daripada kodenya. Data pelatihan bisa dibilang lebih penting daripada keduanya. Komputasi pelatihan, prosedur penyempurnaan, tolok ukur evaluasi, dan pilihan konfigurasi semuanya berkontribusi pada perilaku model dengan cara yang tidak dapat dijelaskan hanya oleh kode sumber.

Kekayaan intelektual tidak hanya ada pada kode sumber model — tetapi juga data pelatihan, pemrosesan, bobot, konfigurasi, dan banyak lagi. Hal ini telah menyebabkan kebingungan yang meluas tentang apa sebenarnya yang termasuk dalam open source di era AI. Undang-Undang AI Uni Eropa telah berupaya memberikan kejelasan definisi, mendefinisikan "AI open source dan gratis" sebagai komponen "yang dapat diakses di bawah lisensi open source dan gratis" — khususnya termasuk "parameter, termasuk bobot, informasi tentang arsitektur model, dan informasi tentang penggunaan model." Definisi Uni Eropa mencakup perangkat lunak, data, dan model termasuk alat, layanan, dan proses dari sistem AI.

Fenomena yang paling merusak dalam kebingungan definisi ini adalah "openwashing"—istilah yang diciptakan oleh komunitas riset AI untuk menggambarkan model yang mengklaim label "open source" sementara sebenarnya hanya merilis sebagian kecil dari apa yang akan membuat mereka benar-benar transparan dan dapat direproduksi. Beberapa large language model yang disebut-sebut sebagai open source yang hanya merilis bobot model tetapi tidak merilis data pelatihan dan kode telah dikritik sebagai sistem "openwashing" yang sebagian besar tertutup.

Seri Llama dari Meta mewakili contoh paling menonjol dari ambiguitas definisi ini. Model-model tersebut merilis bobot dan mengizinkan penggunaan hilir yang substansial, yang memenuhi definisi praktis open source bagi sebagian besar developer. Tetapi mereka tidak merilis data pelatihan, dan lisensi penggunaannya mencakup pembatasan yang menurut Open Source Initiative mencegah mereka memenuhi definisi formal OSI. Banyak developer AI dan komunitas yang lebih luas memperlakukan Llama sebagai open source fungsional; OSI secara formal tidak setuju. Banyak model "terbuka" tidak mengungkapkan apa yang ada dalam set pelatihan, dan mereka mungkin menggunakan data yang salah secara faktual, bias, atau dibatasi hak cipta.

Label "open source" dapat memberikan manfaat nyata bagi perusahaan yang ingin merekrut talenta terbaik atau menarik pelanggan. Perdebatan seputar "openwashing" memiliki implikasi besar terhadap keberhasilan berbagai proyek dalam industri ini, karena kepercayaan yang diberikan kepada model open source dalam konteks penelitian, perusahaan, dan pemerintahan bergantung pada label tersebut yang memiliki makna konsisten dan dapat diverifikasi.

Spektrum Keterbukaan: Dari Tertutup hingga Sepenuhnya Terbuka

Daripada perbedaan biner terbuka/tertutup, lebih akurat untuk memahami AI open source sebagai spektrum dengan berbagai dimensi keterbukaan yang dapat bervariasi secara independen.

Di ujung spektrum yang paling tertutup terdapat model seperti versi lengkap GPT-4 dan Claude — di mana bobot, data pelatihan, maupun kode pelatihan tidak tersedia untuk umum. Model-model ini hanya dapat diakses melalui API, di mana developer mengontrol semua keputusan deployment, memantau semua penggunaan, dan dapat memperbarui atau menarik model kapan saja. Pengguna berinteraksi dengan output model tetapi tidak memiliki visibilitas atau kendali atas model itu sendiri.

Satu langkah lebih terbuka adalah model yang merilis bobotnya secara publik di bawah lisensi penggunaan, yang memungkinkan developer untuk menjalankan model secara lokal, menyempurnakannya pada data khusus, dan mengintegrasikannya ke dalam aplikasi tanpa ketergantungan API. Keluarga Llama dari Meta, model Mistral, dan Qwen dari Alibaba sebagian besar termasuk dalam kategori ini. Model-model ini memberi developer kebebasan praktis yang substansial, yaitu kita dapat menjalankannya secara pribadi di perangkat keras kita sendiri, memodifikasi perilakunya melalui penyempurnaan, dan menerapkannya di lingkungan di mana pengiriman data ke API eksternal akan tidak praktis atau tidak diizinkan. Tetapi proses pelatihannya tetap tidak transparan.

Lebih jauh di sepanjang spektrum terdapat model yang merilis bobot, dokumentasi arsitektur, dan beberapa detail pelatihan, tetapi bukan kumpulan data pelatihan lengkap. DeepSeek V3 dan R1 menempati ruang ini bagi banyak peneliti, yaitu merilis informasi teknis yang cukup untuk memahami dan mereproduksi arsitektur model sambil menjaga elemen-elemen dari alur pelatihan tetap pribadi.

Di ujung yang paling terbuka sepenuhnya terdapat proyek-proyek seperti Pythia, BLOOM, dan karya yang berasal dari EleutherAI dan Allen AI, yaitu proyek-proyek yang merilis bobot model, kode pelatihan, data pelatihan, kode evaluasi, dan dokumentasi yang cukup untuk mereproduksi proses pelatihan dari awal. Ini adalah model yang paling sesuai dengan semangat asli gerakan perangkat lunak open source, meskipun juga yang paling intensif sumber daya untuk diproduksi karena komitmen terhadap transparansi penuh tidak hanya membutuhkan rilis model terlatih tetapi juga mendokumentasikan dan mempublikasikan setiap langkah pembuatannya.

Model dan Proyek AI Open Source

Meta Llama

Seri Llama dari Meta adalah keluarga model AI berbobot terbuka yang paling banyak digunakan di dunia. Llama, yang dirilis pada tahun 2023, dan penerusnya telah digambarkan sebagai "Android-nya chatbot" — sebuah perbandingan yang mencakup ketersediaan terbukanya dan perannya sebagai fondasi tempat ribuan aplikasi hilir dibangun. Sama seperti sifat open source Android yang memungkinkannya untuk menggerakkan sebagian besar ponsel pintar di dunia, bobot terbuka Llama telah memungkinkan developer di seluruh dunia untuk membangun, menyempurnakan, dan men-deploy sistem AI yang mumpuni tanpa bergantung pada satu penyedia.

Dimensi geopolitik dari rilis Llama Meta bukanlah kebetulan. AI open source cenderung mendapatkan lebih banyak dukungan dan adopsi di negara dan perusahaan yang tidak memiliki model AI terkemuka sendiri — dan model open source Amerika memastikan bahwa ketika developer di negara lain membangun di atas fondasi AI open source, mereka membangun di atas teknologi yang dikembangkan Amerika, bukan teknologi Tiongkok atau alternatif lainnya. AS memiliki kepentingan untuk memastikan bahwa program open source yang digunakan developer perangkat lunak di dunia maya dan seterusnya sebagian besar dibuat oleh Amerika dan sekutunya — bukan Tiongkok.

DeepSeek R1 dan V3

Rilis model R1 DeepSeek pada Januari 2025 memicu debat kebijakan AI global yang menunjukkan betapa pentingnya AI open source. Sebuah perusahaan AI Tiongkok telah merilis model dengan kemampuan penalaran yang kompetitif dengan penawaran terbaik OpenAI — secara terbuka, dengan biaya komputasi yang jauh lebih rendah, dan tersedia untuk diunduh dan dijalankan oleh siapa pun. Model R1 DeepSeek memanfaatkan prinsip-prinsip open source untuk memberikan kemampuan AI terbaik dengan biaya yang jauh lebih rendah daripada biaya tipikal.

Reaksinya cepat dan intens. Pertanyaan segera muncul tentang apakah data pelatihan model tersebut bersumber dengan tepat, apakah mengandung sensor atau manipulasi tersembunyi, dan apakah ketersediaan terbuka model AI Tiongkok dengan kemampuan yang hampir mutakhir menciptakan risiko keamanan nasional. AI open source menjadi bagian dari persaingan geopolitik AS-Tiongkok setelah DeepSeek merilis model AI generatif R1 sumber terbukanya pada Januari 2025, yang menimbulkan kekhawatiran tentang privasi data, sensor, dan keamanan nasional.

Meta Llama, Mistral, dan Ekosistem AI Terbuka Eropa

Mistral AI, sebuah perusahaan rintisan Prancis, telah menjadi salah satu kontributor paling signifikan untuk AI open source dari luar Amerika Serikat. Rilis model Mistral dan Mixtral menunjukkan bahwa tim kecil dengan upaya terfokus dapat membangun model open source yang kompetitif, dan komitmen ganda perusahaan terhadap rilis terbuka dan produk komersial mewakili satu model untuk pengembangan AI open source yang berkelanjutan. Ekosistem AI open source Eropa, yang sebagian dipercepat oleh kebijakan Uni Eropa yang memberikan perlakuan regulasi yang lebih ringan untuk model open source berdasarkan Undang-Undang AI, telah menjadikan perusahaan AI Eropa sebagai kontributor yang berarti bagi pengembangan open source global.

PyTorch, TensorFlow, dan Foundation Layer

Di bawah level model AI spesifik terdapat kerangka kerja pembelajaran mendalam open source yang memungkinkan AI modern. PyTorch — yang dikelola oleh Meta dan komunitas kontributor global — adalah kerangka kerja penelitian dominan untuk pembelajaran mendalam. TensorFlow, yang dikembangkan oleh Google, telah menjadi salah satu kerangka kerja pembelajaran mendalam produksi yang paling banyak digunakan. Kerangka kerja dasar ini secara tegas sepenuhnya open source dan telah menjadi fundamental bagi setiap kemajuan AI yang signifikan dalam dekade terakhir — mereka adalah substrat tempat model open source dan berpemilik dibangun.

Pada Desember 2025, Linux Foundation menciptakan Agentic AI Foundation, yang mengambil alih kendali beberapa protokol AI agenik open source dan teknologi lain yang dibuat oleh OpenAI, Anthropic, dan Block. Perkembangan ini menandakan ambisi Linux Foundation untuk memperluas model suksesnya dalam mengelola infrastruktur sumber terbuka dasar ke domain sistem AI agenik yang sedang berkembang.

Manfaat AI Open Source

Mendemokratisasi Akses dan Mempercepat Inovasi

Manfaat paling mendasar dari AI open source adalah demokratisasi akses ke teknologi yang canggih. Pada intinya, AI open source mendemokratisasi teknologi, sehingga memungkinkan developer dan pemilik bisnis untuk mengakses alat-alat mutakhir tanpa hambatan biaya tinggi atau batasan kepemilikan. Organisasi yang kekurangan sumber daya untuk membayar akses API AI mutakhir — lembaga penelitian, organisasi nirlaba, usaha kecil, developer individu di negara-negara tanpa mata uang yang kuat relatif terhadap harga USD — dapat mengakses sistem AI yang mumpuni melalui alternatif open source.

Demokratisasi ini secara langsung mempercepat inovasi. Ketika lebih banyak orang dapat mengakses, mempelajari, dan membangun sistem AI, tingkat inovasi meningkat secara substansial. AI open source membantu mempercepat pengembangan solusi AI melalui iterasi cepat, tinjauan sejawat, dan pemecahan masalah bersama. Kecerdasan kolektif dari komunitas developer global menemukan bug, mengidentifikasi peningkatan, dan menemukan aplikasi lebih cepat daripada yang dapat dilakukan oleh satu organisasi saja.

Transparansi dan Kemampuan Audit

Sistem AI berpemilik adalah kotak hitam. Pengguna dan regulator berinteraksi dengan outputnya tanpa visibilitas ke dalam penalaran, data pelatihan, langkah-langkah keamanan, atau mode kegagalan yang menghasilkan output tersebut. Bekerja secara terbuka cenderung meningkatkan keamanan, karena lebih banyak mata dapat menemukan bug atau kerentanan dalam suatu proyek. Demikian pula, transparansi ini dapat membantu mengatasi kekurangan etika AI atau mengurangi kesalahan.

Bagi regulator yang berupaya memastikan bahwa sistem AI aman, adil, dan selaras dengan kepentingan publik, model open source memberikan dasar yang jauh lebih mudah diaudit. Menggunakan AI open source memungkinkan suatu organisasi untuk mengatasi bias dan informasi yang salah dalam data pelatihan dengan cara yang tidak memungkinkan oleh model berpemilik. Kemampuan untuk memeriksa dan memperbaiki ini tidak hanya bernilai komersial — ini adalah prasyarat untuk jenis pengawasan regulasi yang dibutuhkan oleh tata kelola demokratis teknologi yang canggih.

Privasi, Kedaulatan Data, dan Biaya

Menjalankan model AI secara lokal di infrastruktur kita sendiri — yang dimungkinkan oleh bobot terbuka — akan menghilangkan risiko transmisi dan penyimpanan data yang ditimbulkan oleh layanan berbasis API. Bagi organisasi yang memproses informasi pribadi, keuangan, medis, atau informasi yang dilindungi secara hukum yang sensitif, kemampuan untuk menjalankan model AI sepenuhnya di dalam infrastruktur mereka sendiri tanpa paparan data eksternal bukanlah fitur kenyamanan tetapi persyaratan kepatuhan.

Implikasi biayanya sama signifikan. Perusahaan seperti DeepSeek membuktikan kekuatan model open source, memberikan kinerja yang setara dengan raksasa berpemilik seperti OpenAI sambil secara signifikan menurunkan biaya dan mendorong kolaborasi. Selisih harga 25 kali lipat antara model open source termurah dan API komersial terdepan, yang didokumentasikan dalam perbandingan biaya AI, menciptakan argumen efisiensi biaya yang menarik untuk penerapan perusahaan bervolume tinggi bahkan ketika perbedaan kualitas antara model terbuka dan berpemilik itu nyata.

Untuk Siapa AI Open Source?

Memahami siapa yang paling diuntungkan dari AI open source membantu memperjelas konteks praktis untuk mengevaluasi apakah model open source atau berpemilik sesuai untuk kasus penggunaan tertentu.

Developer dan peneliti mewakili konstituen yang paling alami untuk AI open source. Kemampuan untuk memeriksa internal model, menjalankan model secara lokal untuk eksperimen, menyempurnakan pada data spesifik domain, dan membangun tanpa ketergantungan API atau batasan penggunaan menjadikan model open source sebagai fondasi bagi sebagian besar penelitian AI dan semakin banyak bagian dari pengembangan AI produksi. Komunitas AI open source sangat penting bagi lembaga akademis, peneliti keamanan AI, dan pengembang independen yang kekurangan sumber daya untuk membayar akses API terdepan dalam volume penelitian.

Perusahaan dengan persyaratan sensitivitas data menemukan dalam AI open source kemampuan untuk menjalankan model pada infrastruktur pribadi, sehingga menghilangkan kekhawatiran transmisi data dan memungkinkan penerapan di lingkungan yang diatur di mana penggunaan API eksternal akan memerlukan tinjauan kepatuhan yang ekstensif. Bagi organisasi perawatan kesehatan, lembaga keuangan, firma hukum, dan lembaga pemerintah, kemampuan untuk memproses informasi sensitif melalui model yang diterapkan secara lokal daripada API komersial seringkali menjadi faktor penentu.

Negara dan organisasi tanpa model AI eksklusif terkemuka telah menjadi pendukung paling konsisten untuk AI open source. AI open source cenderung mendapatkan lebih banyak dukungan dan adopsi di negara dan perusahaan yang tidak memiliki model AI terkemuka sendiri. Proyek open source ini dapat membantu melemahkan posisi pesaing bisnis dan geopolitik dengan model eksklusif terkuat — yang menjelaskan mengapa negara-negara kecil mendukung akses AI open source dan mengapa negara-negara besar berhati-hati terhadap model mereka yang paling mumpuni yang dijadikan open source.

Aplikasi yang sensitif terhadap biaya di mana AI perlu dijalankan dalam volume tinggi atau di mana perbedaan harga antara open source dan API komersial signifikan secara operasional sangat cocok untuk penerapan open source. Seiring dengan menyempitnya kesenjangan kinerja antara open source dan model eksklusif terdepan, argumen biaya untuk AI open source terus menguat.

Advertisement:

Jadi, AI open source bukanlah satu hal tunggal. Ini adalah spektrum pendekatan terhadap pengembangan AI yang memiliki komitmen — bervariasi dalam kedalaman dan ketulusan — untuk membuat sistem AI tersedia untuk inspeksi, modifikasi, dan redistribusi. Pada kondisi terbaiknya, ini mewakili perluasan ide-ide paling kuat dari gerakan software open source ke dalam teknologi paling transformatif di zaman kita. Pada kondisi terburuknya, ini mewakili strategi pemasaran yang meminjam kredibilitas open source tanpa memberikan substansinya.

Memahami apa itu AI open source — dan apa yang bukan — bukanlah lagi pengetahuan opsional bagi siapa pun yang terlibat secara serius dengan teknologi, kebijakan, atau bisnis. Ini adalah lensa yang semakin sering digunakan untuk mengajukan pertanyaan-pertanyaan terpenting tentang pengembangan AI.