태그 보관물: ascii

ascii

쉘에서 비 ASCII 문자를 식별하려면 어떻게해야합니까? 방법이 grep, awk, perl,

모든 비 ASCII 문자 그들이 같은 명령 줄 유틸리티를 사용하여 파일에서 발생되는 줄 번호를 인쇄하는 간단한 방법이 grep, awk, perl, 등?

텍스트 파일의 인코딩을 UTF-8에서 ASCII로 변경하고 싶지만 그렇게하기 전에 파일 변환 루틴에 의해 예기치 않은 문자 변경이 발생하지 않도록 ASCII가 아닌 문자의 모든 인스턴스를 수동으로 바꾸십시오.



답변

$ perl -ne 'print "$. $_" if m/[\x80-\xFF]/'  utf8.txt
2 Pour être ou ne pas être
4 Byť či nebyť
5 是或不

또는

$ grep -n -P '[\x80-\xFF]' utf8.txt
2:Pour être ou ne pas être
4:Byť či nebyť
5:是或不

utf8.txt는

$ cat utf8.txt
To be or not to be.
Pour être ou ne pas être
Om of niet zijn
Byť či nebyť
是或不


답변

텍스트 파일의 인코딩을 UTF-8에서 ASCII로 변경하고 싶습니다 …

… 비 ASCII 문자의 모든 인스턴스 교체 …

그런 다음 변환 도구에 지시하십시오.

$ iconv -c -f UTF-8 -t ASCII <<< 'Look at 私.'
Look at .

$ iconv -c -f UTF-8 -t ASCII//translit <<< 'áēìöų'
aeiou


답변