Dalam dunia pengembangan web, sering kali kita harus menampilkan cuplikan atau ringkasan teks dari konten HTML atau hasil input pengguna. Namun, jika tidak dibersihkan dengan benar, teks tersebut bisa mengandung tag HTML, skrip PHP, hingga karakter entitas yang membuat tampilan menjadi kacau.
Artikel ini akan membahas cara menghapus semua tag HTML, PHP, dan karakter khusus lainnya menggunakan fungsi bawaan PHP.
Beberapa alasan umum mengapa kita perlu membersihkan teks:
Aman ditampilkan di frontend tanpa memunculkan kode HTML atau skrip.
Mencegah XSS (Cross Site Scripting) jika ada kode yang belum terfilter.
Menampilkan cuplikan teks di halaman blog, beranda, atau hasil pencarian.
Menjaga tampilan tetap rapi dan enak dibaca pengguna.
Berikut kombinasi fungsi yang umum digunakan:
strip_tags()
Fungsi ini akan menghapus semua tag HTML dan PHP dari teks. Misalnya, <b>tebal</b>
akan menjadi tebal
.
html_entity_decode()
Teks HTML sering mengandung entitas seperti
, &
, atau '
yang perlu dikonversi agar lebih natural dibaca.
preg_replace()
Digunakan untuk menghapus karakter aneh seperti simbol, emoji, atau huruf non-standar. Kamu bisa sesuaikan regex-nya.
substr()
dan trim()
Untuk mengambil ringkasan teks dengan panjang tertentu, dan membuang spasi berlebih di awal dan akhir kalimat.
Misalnya kamu memiliki artikel dengan isi dari database:
Maka hasil deskripsi
setelah diproses akan menjadi:
Membersihkan konten dari HTML, PHP, dan karakter asing sangat penting untuk memastikan tampilan frontend yang aman dan rapi. Dengan beberapa fungsi PHP seperti strip_tags
, html_entity_decode
, dan preg_replace
, kamu bisa mengolah teks mentah menjadi ringkasan yang bersih dan siap tampil.
Bangnopi Tips:
Saat menampilkan konten dari database di halaman publik, selalu bersihkan kontennya terlebih dahulu untuk menghindari potensi celah keamanan dan tampilan yang berantakan.