Author Avatar

Staff

0

Share post:

PHP comodo strip_tags( ) funzione rimuove i tag HTML che sembrano , , o . Tuttavia, non capisce i tag è la rimozione. Sarà ciecamente rimuovere il tag di apertura e chiusura in stile

, ma lasciare il codice dello stile di confondere l’analisi del testo. Questa rimozione tag semplicistica causa anche le parole su entrambi i lati delle etichette da incollare, creando difficile analizzare il testo.

Per risolvere questi problemi, è necessario elaborare alcuni tag prima di utilizzare strip_tags() . Questo è fatto facilmente con alcune espressioni regolari che:

Rimuovere coppie di tag HTML e contenuti racchiusi per gli stili, gli script, oggetti incorporati, ecc
Aggiungere interruzioni di linea attorno a livello di blocco per evitare che i tag parola unirsi problemi dopo la rimozione del tag.
Una volta fatto questo, chiamare strip_tags() per rimuovere i tag rimanenti.

Di seguito è riportato il codice di esempio per fare questo. Le sue espressioni regolari sono più dettagliati di quanto strettamente necessario, ma aiuta a rendere più chiara la funzione. Maggiori spiegazioni seguire in sezioni dopo il codice.

/ **
* Rimuovere i tag HTML, compreso il testo invisibile, come stile e
* Codice di script e oggetti incorporati. Aggiungere interruzioni di linea attorno
* A livello di blocco per evitare che i tag parola unirsi dopo la rimozione del tag.
* /
strip_html_tags funzione ($ testo)
{
$ Text = preg_replace (
array (
/ / Rimuovi contenuto invisibile
‘@ ]*?>.*? @ siu’,
‘@ ]*?>.*? @ siu’,
‘@ Copione ]*?.*? @ siu’,
‘@ ]*?.*? @ siu’,
‘@ ]*?.*? @ siu’,
‘@ ]*?.*? @ siu’,
‘@ ]*?.*? @ siu’,
‘@ ]*?.*? @ siu’,
‘@ ]*?.*? @ siu’,
/ / Aggiungere interruzioni di riga prima e dopo i blocchi
Indirizzo’@

Parsing Html fatto con il php e preg_match
Come creare una pagina 404 di errore personalizzata