ChatGPT-4 vs ChatGPT-3.5 Default vs. ChatGPT-3.5 Legacy: Perbedaan Diuji

ChatGPT 4.0 diharapkan membuat gelombang besar di dunia chatbot. Tapi apakah benar-benar lebih unggul dari pendahulunya? Mari kita periksa.

ChatGPT hanyalah puncak dari gunung es otomasi yang akan datang, dengan Google, Microsoft, dan banyak perusahaan AI-first lainnya mengikuti.

Sebagai permulaan, kami telah menemukan beberapa chatbot seperti ChatGPT, banyak di antaranya bukan milik teknologi besar.

Tapi sebut saja itu kekuatan pemasaran; ChatGPT masih menjadi raja yang berkuasa dari semua bot AI semacam itu. Itu dapat melakukan banyak hal, termasuk matematika, puisi, dan posting blog, dan orang-orang bahkan menggunakannya untuk mengajukan tuntutan hukum.

DoNotPay sedang berupaya menggunakan GPT-4 untuk menghasilkan “gugatan satu klik” untuk menuntut robocaller sebesar $1.500. Bayangkan menerima panggilan, mengklik tombol, panggilan ditranskripsikan dan gugatan 1.000 kata dihasilkan. GPT-3.5 tidak cukup baik, tetapi GPT-4 menangani pekerjaan dengan sangat baik: pic.twitter.com/gplf79kaqG

– Joshua Browder (@jbrowder1) 14 Maret 2023

Ini memiliki banyak profesional yang mengkhawatirkan keahlian mereka akan sia-sia dalam waktu dekat.

Namun, saya telah membaca posting Linkedin yang berbunyi:

AI tidak akan menggantikan Anda, tetapi orang yang menggunakan AI bisa.

Jadi, tetap berharap, mari kita dididik tentang pembaruan ChatGPT terbaru dan lihat perbedaannya dari versi sebelumnya.

ChatGPT: Legacy, Default, dan Pembaruan

Jadi ada tiga versi yang tersedia untuk pengguna berbayar: Legacy (3.5), Default (3.5), dan Pembaruan ChatGPT terbaru (4).

Meskipun kami akan membahas lebih dalam tentang kemampuannya, inilah yang dikatakan OpenAI tentang perbedaannya:

Sumber: OpenAI

Jadi, sementara pengguna gratis hanya memiliki Legacy 3.5 untuk dimainkan, langganan premium menawarkan ketiganya untuk mencoba dan menerima apa yang menurut pengguna adalah yang terbaik.

Untuk meringkas gambar sebelumnya, paket berbayar adalah tentang mendapatkan hasil yang lebih akurat dengan kecepatan yang layak. Namun, perbedaannya hanya terlihat jika petunjuknya rumit dan membutuhkan kreativitas.

ParameterChatGPT 4ChatGPT 3.5Bar Skor UjianTop 10%Bawah 10%AI2 Reasoning Challenge (ARC)96.3%85.2%Python Coding Score67%48.1%Interpretasi VisualYaTidakKonteksLebih dari 25k kataKurangSumber: OpenAI

Selain itu, ChatGPT 4 dapat menerima input visual.

Nah, cukup definisi buku teks. Mari kita mengotori tangan kita dan mengevaluasi para kandidat ini di medan pertempuran kehidupan nyata.

Bagian selanjutnya penuh dengan gambar yang mungkin tampak tidak jelas. Dalam kasus seperti itu, klik kanan gambar apa saja dan pilih Buka di tab baru untuk melihat dengan benar.

Matematika

Menjadi lulusan teknik, saya tidak dapat membantu melemparkan mereka beberapa masalah dasar. Mari kita mulai dengan persamaan aljabar.

Tahap I

Banyak dari kita telah melihat persamaan ini ax2+bx+c=0, di mana kita harus menyelesaikan untuk X. Di sini, saya memberikan perintah sederhana ini, Selesaikan untuk x: x2 + x – 6 = 0

  Cara Menambahkan Tautan di Canva

Sementara semua memberikan akar yang sama (X= -3,2), Legacy dan Update lebih mirip dalam menggunakan rumus secara langsung (sesuai keinginan siswa mana pun) untuk mengetahui hasilnya.

Namun, Default 3.5 menjelaskan dua metode, termasuk faktorisasi, yang biasanya diterapkan oleh setiap siswa yang terampil saat diberi persamaan biasa.

Tahap II

Selanjutnya, saya memintanya untuk menyelesaikan persamaan kubik yang sedikit rumit: x^3 -12x^2 + 48x – 64 = 0.

Ini benar-benar membuktikan mengapa ChatGPT 4 adalah “pembaruan”.

Berikut tanggapannya:

Semua hype ini dan ChatGPT Legacy and Default tidak dapat menyelesaikan persamaan kubik umum. Namun, Legacy melakukan sedikit lebih baik dan menemukan dua root dengan benar, sementara Default gagal dengan semua.

Pembaruan adalah pemenang yang jelas di tahap kedua dan menyelesaikan persamaan dengan sempurna, menemukan ketiga akar dengan penjelasan yang bagus.

Penalaran Logis

Kita dapat dengan aman mengasumsikan sebagian besar soal matematika dasar memiliki solusi kamus. Jika Anda mengetahui teorema atau rumusnya, masukkan nilainya, dan dapatkan hasilnya.

Dan ChatGPT, sebagai AI, dapat membuat kueri semacam itu bekerja dengan cepat. Namun, penalaran logis adalah wilayah yang berbeda, dengan kemungkinan besar AI gagal.

Tahap I

Saya memberi mereka yang klasik:

A lebih tua dari B.
C lebih tua dari A
B lebih tua dari C.
Apakah pernyataan ketiga benar atau salah jika dua pernyataan pertama benar?

Dan semua versi ChatGPT benar dalam menyatakan bahwa pernyataan ketiga salah.

Selanjutnya, saya menggunakan nama sebagai pengganti alfabet, dan hasilnya mungkin mengejutkan Anda:

Jadi, Default 3.5 melanjutkan kinerjanya di bawah standar dan bingung dengan variasi sederhana ini. Tetap saja, Legacy dan Pembaruan bekerja secara optimal.

Tahap II

Anda mungkin telah memperhatikan sekarang tujuan dari Tahap I dan Tahap II ini adalah untuk menemukan titik perbedaan, di mana kompleksitas prompt yang diberikan memisahkan Pembaruan dari dua lainnya.

Di sini, petunjuknya adalah teka-teki logis sederhana:

Suatu pagi setelah matahari terbit, Rohit sedang berdiri menghadap tiang. Bayangan tiang jatuh tepat di sebelah kanannya. Ke arah mana dia menghadap?
A. Utara
B. Barat
C. Selatan
D. Timur

Yang ini mendorong Legacy untuk memberikan jawaban yang tidak akurat, sedangkan Default menanggapi dengan klarifikasi yang tidak jelas yang mengarah ke kesimpulan yang salah.

Hanya Pembaruan yang bersinar dengan jawaban yang benar, dengan pernyataan yang mudah diikuti.

Surat

Mengajukan tuntutan hukum bisa jadi rumit, tetapi terkadang hal itu tidak terjadi jika Anda dapat membuat draf pemberitahuan pertama yang mencolok.

Di sini, saya pergi dengan prompt ini: Tulis surat kepada Tim Cook untuk menyerahkan apel kepada saya karena tidak membalas salah satu tweet saya.

Lucu, ya! Tapi mari kita lihat apa yang bisa dilakukan AI dari ini.

  9 Solusi Pemasaran Email Terintegrasi AWS SES dengan Biaya Lebih Rendah

Legacy 3.5 langsung mengambil prompt seperti budak robot dan mengeluarkan surat yang dapat membuat saya menjadi bahan ejekan yang sangat baik jika pernah mencapai tujuan yang dimaksudkan.

Default juga tidak bagus. Namun, itu hanya menutup saya seperti yang dilakukan orang tua pemarah kepada anak berusia lima tahun.

Sementara argumen yang dibuat sangat tepat, ini mengakhiri kesenangan di sana dengan sedikit pembelajaran.

Meskipun ini adalah prompt yang cukup sederhana, itu membutuhkan pemikiran dan kreativitas. Dan di situlah kakak laki-laki, Pembaruan, membuat kasusnya:

Pertama, ini dirancang hampir sempurna. Kedua, itu menyelamatkan saya dari pencarian Google untuk alamat kantor pusat Apple (meskipun seseorang harus memverifikasi entri tersebut).

Ketiga, ditulis dengan baik dengan nada resmi dan sentuhan humor. Selain itu, maksudnya jelas di baris subjek itu sendiri.

Dan tetap saja, surat itu menyampaikan sentimen dari penggemar Apple yang tidak puas.

Jadi, ini membuat ChatGPT 4 (alias Pembaruan) jauh di depan sepupu lamanya. Ini sangat cerdas dan memiliki beberapa tanda akal sehat, menjadikannya lebih dari sekadar chatbot yang membosankan dan membosankan.

Puisi

Dengan diluncurkannya ChatGPT, puisi, menurut saya, bisa menjadi titik lemahnya.

Lagi pula, dibutuhkan emosi, kreativitas, dan banyak upaya bagi manusia untuk menciptakan sesuatu yang benar-benar sesuai dengan pembacanya.

Sederhananya, puisi adalah seni yang terbaik, dan diam-diam saya berharap AI gagal. Tapi itu sebelum rekan kerja saya memukul kami semua dengan keras di saluran Slack techking.id dengan kreasi ChatGPT sebelum pembaruan 4.0 ini.

Tahap I

Inilah prompt yang saya berikan kepada kandidat kami: “ungkapkan secara puitis mengapa atau mengapa tidak menyajikan burger, bersama dengan menu mereka saat ini, dapat menguntungkan rantai pizza domino. Simpan kurang dari 100 kata.”

Bisakah Anda melihat perbedaannya?

Versi Default sangat pendek, hanya 32 kata, dan tidak dapat memanfaatkan bandwidth yang tersedia untuk menampilkan kreativitasnya.

The Legacy, meskipun menggunakan kata-kata maksimum di antara ketiganya, menyimpulkan bahwa upaya menyajikan pizza bersama tidak berisiko dan akan menghasilkan kesuksesan yang pasti, yang tidak sepenuhnya benar.

Puisi Pembaruan hanya terdiri dari 53 kata, menghabiskan hampir setengah dari jumlah kata yang diberikan. Tetap saja, sudah jelas tentang imbalan dan potensi jebakan dan tidak dapat mencapai hasil apa pun, yang menurut saya, lebih manusiawi daripada yang lain.

Tahap II

Selanjutnya, saya meminta mereka semua untuk “menjelaskan puisi itu kepada anak berusia lima tahun”.

Menariknya, Legacy tidak bisa mengambil konteks dari percakapan dan menjelaskan “Puisi” secara harfiah. Default memang mengambil konteks dan merangkumnya dalam sebuah paragraf yang masih layak.

Melanjutkan tren, ChatGPT 4 menyederhanakan kreativitasnya sekaligus menjaga rasa puitis tetap hidup.

ChatGPT Premium vs. ChatGPT Gratis

Gratis, bebas, tidak memiliki kecepatan dan akurasi dan tidak cocok dengan ChatGPT 4, tetapi juga tidak sepenuhnya tidak berguna.

  Tweet Balloon Memungkinkan Anda Melihat Garis Waktu Sebagai Hamparan Di Layar Beranda Anda

Untuk membandingkannya secara merata, saya memberikan petunjuk yang sama dengan yang telah kami uji dengan Legacy, Default, dan Update.

🔵 Matematika: Ini memecahkan persamaan kuadrat tetapi memberikan jawaban yang salah untuk kubik. (seperti Legacy dan Default)

🔵 Penalaran Logis: Lulus tahap pertama dengan huruf dan nama tetapi gagal di tahap kedua (seperti Legacy).

🔵 Surat: Tidak menulis surat dan menganggap permintaan itu tidak etis dan tidak pantas. (seperti Default)

🔵 Puisi: Menghasilkan puisi dalam 30+ kata dan menjelaskannya dengan sopan. (mirip dengan Default).

Jadi, kita bisa menyimpulkan bahwa versi gratisnya juga lumayan. Sebenarnya, ini setara dengan Default 3.5 dan bahkan lebih baik dalam beberapa aspek.

Baca juga: Anjuran Kuat Untuk Meningkatkan Pengalaman ChatGPT Anda

Jalan ke Depan

Rumor tentang AI yang menggantikan pekerjaan di masa depan tidak sepenuhnya salah.

Pertama, otomasi melakukan ini di industri manufaktur, dan sekarang ini melebarkan sayap ke tempat lain.

Secara pribadi, ini jauh lebih cepat daripada saya dalam menyelesaikan persamaan kubik, membuat puisi, atau menulis surat. Namun, fakta bahwa ia jarang mengatakan TIDAK pada permintaan dan hampir tidak belajar dari kesalahannya membuat kita tertinggal di belakang kita manusia.

Untuk menegaskan kembali, AI tidak akan menggantikan kita, tetapi seseorang yang menggunakan AI bisa.

Di techking.id, tim pemasaran kami menggunakan ChatGPT dengan cara yang menarik. Misalnya, kami baru saja mencapai pencapaian 100 juta penayangan, dan CEO kami berpikir untuk memberikannya kembali kepada penonton melalui hadiah.

Dan saya kira orang pemasaran membutuhkan judul untuk menarik perhatian pembaca. Jadi, mereka memberikan satu permintaan dan meminta ChatGPT untuk menyarankan beberapa variasi, seperti ini:

Selain itu, kami menggunakannya untuk meringkas konten, memeriksa tata bahasa, menyarankan judul untuk artikel baru, dan lainnya.

Secara meyakinkan, ada banyak cara untuk memanfaatkan dan berpacu dengan stereotip yang melihat AI sebagai sampah yang tidak berguna.

Satu-satunya hal yang perlu diingat adalah harus ada seseorang (manusia) yang menilai pekerjaan AI karena dapat (sangat) tidak akurat dan menyesatkan.

Pembaruan Sungguh Sesuatu!

Dalam pertemuan singkat saya, ChatGPT 4 terasa lebih kreatif, pengertian, dan realistis. Tetap saja, ini adalah mesin dan bisa memberikan jawaban yang salah dengan percaya diri.

Namun yang menakjubkan adalah tingkat pemutakhiran yang telah dilakukan OpenAI pada proyek ini hanya dalam hitungan beberapa bulan.

Dan saya tidak sabar untuk melihat keajaiban pembaruan berikutnya mungkin membingungkan kita!

PS: Bukan hanya jendela obrolan; manfaatkan kekuatannya dengan ekstensi Chrome ChatGPT terbaik ini. Dan apakah Anda pernah berpikir untuk mengintegrasikan ChatGPT dengan Siri?