Regular Expression 3

How to preprocess the article to be neat with Regular Expression

1. Remove email and url 2. Remove byline 3. Remove others 4. Remove whitespace content='''(서울=뉴스1) 이승배 기자 = 박정호 SKT 대표이사가 25일 서울 중구 을지로 SKT타워에서 열린 SK텔레콤 제37기 정기 주주총회에 참석하고 있다. 2021.3.25/뉴스1 SK텔레콤이 주주가치 제고를 위해 한국거래소에 자사주 869만주 소각을 반영한 변경상장을 완료했다고 14일 밝혔다. 발행주식 총수의 10.8% (약 2조6000억원)규모다. 이로써 전날 기준 SK텔레콤의 발행주식 총수는 기존 8075만주에서 7206만주로 줄어들었다. 앞서 SK텔레콤은 지난 4일 올해 인적분할에 앞서 기업가치 및 주주가치 제고를 위해 기존 자사주를 사실상..

regular expression

re Regular Expression. prodlist >>> 0 (직) 데친고사리 1kg(냉장} 1 (직) 깐도라지채 1kg(냉장} 2 콩나물 박스 4kg(상 곱슬이) 3 *삼색수제비 1kg(동성 냉동) 4 *)자숙바지락살 350g(냉동) ptn = "\([^)]+\)}" prodlist = [re.sub(ptn, "", str).strip() for str in prodlist] prodlist >>> ['데친고사리 1kg(냉장}', '깐도라지채 1kg(냉장}', '콩나물 박스 4kg', '*삼색수제비 1kg', '*)자숙바지락살 350g'] prodlist = [ re.sub("([0-9]+)?(k)?g", "", str).strip() for str in prodlist ] prodlist >>..