Anonim

Windows 10 Insider Preview Build 18875 (20H1)

ในตอนที่ 9 ของฤดูกาลที่สองของ Log Horizon เมื่อ ...

ชิโรเอะเสียชีวิตและปรากฏตัวบนเซิร์ฟเวอร์ที่ 14 อย่างไม่เป็นทางการของ Elder Tale เซิร์ฟเวอร์ทดสอบซึ่งถูกกำหนดให้อยู่บนดวงจันทร์แทนที่จะอยู่บนโลก

... เขาตรวจสอบตำแหน่งและกล่องโต้ตอบส่วนใหญ่อ่านไม่ออกบันทึกไว้สำหรับชื่อสถานที่ Mare Tranquillitatis.

ข้อความที่อ่านไม่ออกสามารถถอดรหัสได้หรือเป็นเพียงขยะ?

ใช่ข้อความที่อ่านไม่ออกเป็นผลมาจาก mojibake ซึ่งข้อความต้นฉบับเป็นภาษาญี่ปุ่นที่เข้ารหัสด้วยการเข้ารหัส Shift-JIS ถูกถอดรหัสโดยการเข้ารหัส Windows-1256

หากคุณเคยเปิดหน้าเว็บภาษาญี่ปุ่นหรือไฟล์ข้อความที่เข้ารหัสด้วยการเข้ารหัส Shift-JIS (ชุดอักขระ 2 ไบต์) ภายใต้การเข้ารหัสแบบตะวันตกใน Windows (ชุดอักขระ 1 ไบต์) คุณจะเห็นความถี่สูงของ �� จับคู่กับตัวละครอื่น ๆ ในมุมมองผลลัพธ์ เนื่องจากฉันสังเกตเห็นว่ามีอักขระภาษาอาหรับในภาพฉันจึงใช้ไฟล์ข้อความที่มีอยู่ซึ่งเข้ารหัสเป็น Shift-JIS และลองเปิดด้วยการเข้ารหัสภาษาอาหรับ (Windows) ในเบราว์เซอร์และฉันพบว่าภาษาอาหรับ (Windows) หรือการเข้ารหัสแบบตะวันตกมีการแมปเดียวกันสำหรับ �� และ �� (ซึ่งเป็นอักขระทั่วไปอีกตัวหนึ่งในข้อความที่อ่านไม่ออก)

หลังจากเปรียบเทียบกับหน้าต่างสถานะตำแหน่งที่แสดงผลอย่างถูกต้องและการคาดเดาบางอย่างฉันก็จัดการถอดรหัสข้อความที่อ่านไม่ออกเป็นข้อความภาษาญี่ปุ่นที่เหมาะสม (วงเล็บ และ ถูกเพิ่มเพื่อความชัดเจนและไม่ได้ถอดรหัสจากข้อความที่อ่านไม่ออก):

������������������ ��������������� ��������������� ��������������� ������������ ���������������/��������������������������� ��������������� ������������������������ ������������������������ ���������������/������������ ���������������/������������ 

การแปล:

 Moon Server  Moon Server  Isolated zone/No monster  PVP allowed Special skills allowed Entry restriction/Restricted Exit restriction/Restricted 

ภาคผนวก

ในการตรวจสอบผลลัพธ์คุณสามารถใช้โค้ด Python 3 ต่อไปนี้:

garbled = '��T��[��o��[\n������T��[��o��[\n��]��[�����\n������T��[��o��[\n����������\n�����������]��[�����/������������X��^��[��o��������������\n���������������\n�����������s������������\\���������\n��@���S��������Z��g���p��������\\\n��@��i����������������/�����������\xa0�����\n��@�������o�����������/�����������\xa0�����' print(garbled.encode('Windows-1256').decode('Shift-JIS')) 

ด้านล่างนี้คือไฟล์ สำหรับดูเท่านั้น แหล่งที่มา1 ของโมจิบาเกะเพื่อเปรียบเทียบกับภาพ:

1 ข้อความด้านล่างมีเครื่องหมาย U + 200E จากซ้ายไปขวาเพื่อป้องกันไม่ให้อักขระอารบิกแสดงผลจากขวาไปซ้ายและเปลี่ยนรูปร่างตามตำแหน่ง ปัญหาอีกประการหนึ่งที่ขัดขวางการคัดลอกแบบตรงเกิดจากการมี U + 00A0 No-Break Space ซึ่งจะถูกแปลงเป็นช่องว่างเมื่อคัดลอกจากเบราว์เซอร์

�����T��������[��������o��������[��� ���������������T��������[��������o��������[��� �����]��������[�������������� ���������������T��������[��������o��������[��� ���������������������� ��������������������������]��������[��������������/������������������������������X��������^��������[��������o����������������������������������� ��������������������������������� ��������������������������s������������������������������\������������������������ �����@���������S��������������������Z��������g���������p��������������������\��� �����@��������i�������������������������������������/��������������������������������������������� �����@�������������������o��������������������������/��������������������������������������������� 
1
  • "PvP อนุญาต": หึ สงสัยว่าจะมีความสำคัญหรือไม่