모든 비 ASCII 문자 그들이 같은 명령 줄 유틸리티를 사용하여 파일에서 발생되는 줄 번호를 인쇄하는 간단한 방법이 grep
, awk
, perl
, 등?
텍스트 파일의 인코딩을 UTF-8에서 ASCII로 변경하고 싶지만 그렇게하기 전에 파일 변환 루틴에 의해 예기치 않은 문자 변경이 발생하지 않도록 ASCII가 아닌 문자의 모든 인스턴스를 수동으로 바꾸십시오.
답변
$ perl -ne 'print "$. $_" if m/[\x80-\xFF]/' utf8.txt
2 Pour être ou ne pas être
4 Byť či nebyť
5 是或不
또는
$ grep -n -P '[\x80-\xFF]' utf8.txt
2:Pour être ou ne pas être
4:Byť či nebyť
5:是或不
utf8.txt는
$ cat utf8.txt
To be or not to be.
Pour être ou ne pas être
Om of niet zijn
Byť či nebyť
是或不
답변
텍스트 파일의 인코딩을 UTF-8에서 ASCII로 변경하고 싶습니다 …
… 비 ASCII 문자의 모든 인스턴스 교체 …
그런 다음 변환 도구에 지시하십시오.
$ iconv -c -f UTF-8 -t ASCII <<< 'Look at 私.'
Look at .
$ iconv -c -f UTF-8 -t ASCII//translit <<< 'áēìöų'
aeiou