3 Cara untuk Lebih Baik Menerapkan AI ke Kumpulan Data Kecil

3 Cara untuk Lebih Baik Menerapkan AI ke Kumpulan Data Kecil

Ukuran sampel selalu berperan dalam ilmu data, tetapi ada beberapa contoh di mana risiko, waktu, atau biaya akan membatasi ukuran data Anda: Anda hanya dapat meluncurkan roket satu kali; Anda hanya memiliki begitu banyak waktu untuk menguji vaksin yang sangat dibutuhkan; startup tahap awal atau perusahaan B2B Anda hanya memiliki beberapa poin data pelanggan untuk dikerjakan. Dan dalam situasi data kecil ini, saya menemukan bahwa perusahaan menghindari ilmu data sama sekali atau mereka menggunakannya secara tidak benar. Salah satu masalah yang lebih umum dalam menerapkan AI adalah secara membabi buta mengandalkan data historis untuk memprediksi situasi masa depan — saya menyebutnya “dengan asumsi masa lalu adalah masa depan.”

Contoh umum dari hal ini adalah ketika kita asumsikan model yang telah bekerja dengan sangat baik untuk kami di pasar sebelumnya akan bekerja dengan “keajaiban” yang sama ketika kami menggunakannya untuk meluncurkan produk di pasar baru. Masalahnya adalah, pasar baru kita — masa depan — benar-benar berbeda dari pasar sebelumnya, yang membuat penilaian kita buruk, prediksi yang salah, dan hasil bisnis yang lesu.

Daripada mengasumsikan masa lalu adalah masa depan, berikut adalah tiga cara untuk menerapkan AI dengan lebih baik ke kumpulan data kecil:

1. Letakkan data eksternal untuk bekerja. Bagi mereka yang mengandalkan data historis, saya sarankan memanfaatkan data eksternal dan menerapkan pemodelan serupa. Kami bergantung pada ini lebih dari sebelumnya dalam sejarah kami karena munculnya sistem rekomendasi yang digunakan oleh Netflix, Amazon, Spotify, dan lainnya. Bahkan jika Anda hanya memiliki satu atau dua pembelian di Amazon, mereka memiliki begitu banyak informasi tentang produk di dunia dan orang-orang yang membelinya (misalnya, data eksternal), sehingga mereka dapat membuat prediksi yang cukup akurat untuk pembelian Anda berikutnya.

Demikian pula, jika Anda adalah perusahaan B2B yang mencoba memprediksi klien Anda berikutnya, Anda dapat membangun “profil mendalam” dari calon klien berdasarkan data eksternal untuk menerapkan teknik pemodelan yang mirip. Bahkan dengan hanya beberapa contoh positif untuk dikerjakan, proses ini dapat melakukan banyak hal untuk memandu strategi masuk ke pasar Anda.

2. Gunakan iterasi singkat. Salah satu kemunduran menganggap masa lalu adalah masa depan adalah membatasi kreativitas dan inovasi kita. Jika memungkinkan, buat lingkungan lab Anda sendiri di mana Anda dapat memperkenalkan lebih banyak variabel dan hasil yang belum pernah digunakan sebelumnya dan dengan cepat menjalankan beberapa uji coba (misalnya, pengujian A/B) untuk dipelajari. Pendekatan ini bekerja dengan baik dalam kampanye pemasaran di mana Anda tidak perlu menunggu sampai akhir siklus penjualan yang panjang untuk menerima umpan balik seputar konversi prospek. Dengan menjalankan iterasi percobaan dan kesalahan singkat ini di lingkungan di mana Anda bisa mendapatkan umpan balik dengan cepat, Anda bisa mendapatkan lebih banyak wawasan dari kumpulan data yang lebih kecil dan meningkatkan pemodelan dan kreativitas.

3. Membawa semantik melalui keahlian manusia. Bila Anda memiliki lebih sedikit data tetapi memiliki banyak variabel, Anda dapat mengalami masalah pemotongan data yang terlalu tipis. Bayangkan menganalisis pembelanja online yang membeli popok, botol, dan dekorasi kamar bayi. Anda memperbesar terlalu dekat dan Anda tidak melihat pola bahwa orang ini mungkin memiliki bayi. Pengetahuan eksternal dan keahlian manusia dapat membantu bisnis mencapai hasil yang lebih baik dengan lebih sedikit titik data dengan menerapkan pemodelan semantik atau konteks di sekitar variabel ini dan mempercepat pembelajaran mesin. Trik untuk mendapatkan hak ini adalah dengan membangun taksonomi yang kuat (juga dikenal sebagai ontologi). Kami bekerja dengan salah satu perusahaan perangkat medis terbesar di luar sana, dan dengan jutaan nomor SKU dalam katalog mereka, sangat penting bagi pakar manusia untuk mengembangkan taksonomi untuk memahami dan mengkarakterisasi keluarga produk agar juga memahami pola pelanggan dan meningkatkan pemodelan prediktif.

Sebelum menjelajah ke dunia teknologi perusahaan, saya menghabiskan bertahun-tahun bekerja di bidang kontraterorisme, di mana kami menerapkan AI dan pembelajaran mesin untuk membuat profil dan mengidentifikasi calon teroris, antara lain . Sangat sulit untuk membuat model prediksi untuk memerangi terorisme karena selalu ada cara baru untuk menyerang, jadi menganggap apa yang berhasil di masa lalu akan berhasil di masa depan tidak pernah menjadi pilihan bagi kami para ilmuwan data. Kami terus-menerus harus memikirkan cara baru untuk menerapkan pembelajaran mesin ke kumpulan data besar dan kecil untuk mengidentifikasi teroris sebelum mereka melakukan kejahatan — kami tidak bisa tidak melakukannya.

Mungkin itu sebabnya saya Saya sangat bersemangat membantu perusahaan memutus siklus penggunaan data historis dalam skenario yang tidak sesuai. Itu tidak akan mendorong pemikiran, kreativitas, atau inovasi baru untuk bisnis Anda. Sama seperti kontraterorisme, perusahaan B2B yang gagal untuk terus-menerus berinovasi dalam strategi data mereka dapat berarti kematian produk baru, dan pada akhirnya, bisnis.

Baca selengkapnya