close

import re

sim = re.sub('[-\s+\.\!\/_,$%^*()+<=>~》《;“”\"\']+|[+——!○↓,■★。?、~@#¥%……&*():>╴/▽\╴<│]+', "", sim)
sim = re.sub(r'[0-9]',"", sim)  #去除數字
sim = re.sub(r'[a-zA-Z]',"", sim)  #去除英文

另外 r'的用法
r'\!\n'
沒有r的話需要打兩次斜槓
'\\!\\n'

 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 晨柚 的頭像
    晨柚

    晨柚的部落格

    晨柚 發表在 痞客邦 留言(0) 人氣()