블로그 이미지
초딩입맛제주아재
하고 싶은 것만 하며 살고 싶다

calendar

          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            
2008. 2. 22. 17:30 Programing/HTML/JavaScript/CSS
어제 정규식 수정하고 포스팅 하는걸 깜빡했네요^^;;

첫 정규식에서는 도메인에 하이픈이나 한글 도메인 추출이 안됐었죠.





또다시 머리를 이리굴리고 저리굴리고 하다가 해결했습니다.





정규식을 이렇게 바꿔봤습니다.
/(http(s)?:\/\/)?\S+(\.[^(\n|\t|\s|\/))]+)+/gi

이전 것은 이랬죠.
/(http(s)?:\/\/)?\w+\.\w+(\.\w+)+/gi

\S는 공백을 제외한 문자입니다.
\S를 씀으로써 추가적인 문제가 발생할 수도 있습니다만, 그 문제는 생각하지 않기로 했습니다.
정 거슬리면 [a-zA-Z0-9가-힣] 이런 식으로 쓸 수도 있습니다만,
아직은 원하는 결과를 보여주니 도메인추출 정규식은 여기서 마무리를 지어야 겠습니다.^^;
혹시 더 좋은 방법 알고 계신분은 지도 부탁드립니다~~


posted by 초딩입맛제주아재

댓글을 달아 주세요

  1. BlogIcon 도아 2008.02.27 13:35  Addr Edit/Del Reply

    정규식을 가장 확실하게 사용할 수 있는 언어는 역시 Unix의 정규식을 확장한 Perl이 아닌가 싶더군요. 그외의 언어에도 도입이 됐지만 Perl만큼 확실하게 동작하는 것은 보지 못한 것 같습니다.

  2. 트위기 2008.12.08 17:33  Addr Edit/Del Reply

    감사합니다. 좋은 예제가 되었습니다^^

  3. kris 2010.08.27 01:01  Addr Edit/Del Reply

    "/"가 맨 앞에 붙은 경우는 같이 추출되어 버리네요..
    Sample은 잘 보았습니다.

  4. 덕분에 해결하고 갑니다.
    즐거운 하루되세요

  5. 예제는 잘 보았습니다 ~ 그런데

    9.000.000을52.000으로이용가능하십니다.확인부탁드립니다

    이런 문자열이 있는경우에도 URL 도메인으로 추출을 하네요 ;;