30/09/2018, 18:29

Tách file txt cho trước thành các file riêng rẽ

Gỉa sử có 1 file txt dạng song ngữ Trung Việt, gồm các đoạn văn song ngữ
(đã dịch của nhau). Cứ mỗi đoạn tiếng Trung bên trên là 1 đoạn tiếng Việt
bên dưới (đã được dịch) liên tiếp nhau như vậy.

Ở dưới là 1 file giả sử có 2 đoạn (mỗi đoạn có thể có nhiều hơn 1 câu) như mô tả ở trên, như sau:

中国农历的五月五日是一个重要的节日,叫做端午节。它是一个古老的传统节日,有两千多年的历史。
Mùng năm tháng năm âm lịch là lễ hội quan trọng của Trung Quốc, gọi là tết Đoan Ngọ. Đây là một
lễ hội truyền thống cổ xưa, có hơn hai ngàn năm lịch sử.
关于端午节的起源有很多说法,其中,最有影响力的一种说法是:
Có rất nhiều cách lý giải liên quan đến nguồn gốc của tết Đoan Ngọ, trong đó, cách lý
giải có ảnh hưởng nhất là:

Yêu cầu đặt ra là: Tách file trên thành 2 file, 1 file (gọi là file 1) chỉ chứa nội dung
là tiếng Trung, File 2 chỉ chứa nội dung là tiếng Việt. Đương nhiên là thứ tự các đoạn trên 2 file
thành phần phải giống như thứ tự xuất hiện của nó trong file ban đầu.
Cụ thể, 2 file thành phần như sau:

File 1:
中国农历的五月五日是一个重要的节日,叫做端午节。它是一个古老的传统节日,有两千多年的历史。
关于端午节的起源有很多说法,其中,最有影响力的一种说法是:
File 2:
Mùng năm tháng năm âm lịch là lễ hội quan trọng của Trung Quốc, gọi là tết Đoan Ngọ. Đây là một
lễ hội truyền thống cổ xưa, có hơn hai ngàn năm lịch sử.
Có rất nhiều cách lý giải liên quan đến nguồn gốc của tết Đoan Ngọ, trong đó, cách lý
giải có ảnh hưởng nhất là:

Mình up lên để CẢ NHÀ CÙNG THẢO LUẬN CÁCH LÀM NHÉ. Thanks các bạn ^^!!!

vũ xuân quân viết 20:45 ngày 30/09/2018

trước hết phải biết bảng mã chữa tiếng trung và tiếng việt.
Dựa vào bảng mã đó để so sánh, tách 2 làm 2 file txt.

Bài liên quan
0