Regex za pokupiti meta description

Zapeo sama na jednoj naizgled jednostavnoj stvari. Znači budući da header neke stranice ne mogu citati na normalan nacin (DOM), trebao bih napisati regex koji ce pokupiti meta description.

imam sljedeci kod:

Znači u data varijabli imam kompletan kod neke stranice, i sada regularnim izrazom treba doći do njezinog descriptiona. Ovaj moj kod gore radi, ali u vrlo ograničenom broju slučajeva. Znači samo kada su i name i content unutar navodnika, i idu točno tim redosljedom, prvo name pa odmah iza njega content.

E sada meni treba netko sa vise iskustva sa regularnim izrazima da ovo podesi tako da radi i u sljedecim situacijama
[list=1]
[:pxzdsbjn]name ili content se nalaze unutar jednostrukih navodnika (npr. name=‘description’)[/:m:pxzdsbjn]
[:pxzdsbjn]name ili content uopće nisu unutar navodnika (npr. name=description …) [/:m:pxzdsbjn]
[:pxzdsbjn]name ili description su unutar navodnika (npr. name=“description”…)[/:m:pxzdsbjn]
[:pxzdsbjn]Nije bitno kojim redosljedom idu name i content unutar meta taga[/:m:pxzdsbjn][/list:o:pxzdsbjn]

Hvala unaprijed

Probaj ovo:

/content=["']*([^"'>]+)["']*/

Jedino ako je u contentu i space znak (npr. content=foo bar name=baz) regex će uhvatiti cijeli string do ‘>’.
Tweakaj at will.


Copyright © 2020 WM Forum - AboutContact - Sponsored by: Mydataknox & Webmaster.Ninja