체코어-체코-핀란드어 사전이 있는데 체코어 동의어가 두 개 연속되어 있어요.
예:
záchod (m); toaleta (f) WC; käymälä; miestenhuone; naistenhuone; vessa
동의어는 세미콜론으로 구분됩니다. 다음 단어(동의어)가 다음 줄에 있으면 좋겠습니다.
이와 같이:
toaleta (f) WC; käymälä; miestenhuone; naistenhuone; vessa
záchod (m) WC; käymälä; miestenhuone; naistenhuone; vessa
답변1
약간의 Perl을 사용하면 이 작업을 수행할 수 있습니다. 단일 단어와 세 개의 체코어 단어를 테스트하기 위해 입력 내용을 약간 수정했습니다.
$ cat dictionary
záchod (m); toaleta (f) WC; käymälä; miestenhuone; naistenhuone; vessa
single (f) WC; test; words; go; here
first (f); second (n); third (m) WC; singleton
$ cat word_per_line.pl
open($dictionary, '<', "./$ARGV[0]");
while( $word = <$dictionary> ) {
$word =~ /(.*) (WC;.*)/;
@czech = split(/; /, $1);
foreach (@czech) {
print "$_\t$2\n";
}
}
$ perl word_per_line.pl dictionary
záchod (m) WC; käymälä; miestenhuone; naistenhuone; vessa
toaleta (f) WC; käymälä; miestenhuone; naistenhuone; vessa
single (f) WC; test; words; go; here
first (f) WC; singleton
second (n) WC; singleton
third (m) WC; singleton