วิธีอ่านไฟล์ DOC โดยใช้ PHP

โปรแกรมเมอร์ PHP มักจะมองหาวิธีที่จะขยายการทำงานของภาษานี้นอกเขตความสะดวกสบาย PHP ส่วนใหญ่จะใช้กับระบบปฏิบัติการ Linux แต่ผู้เยี่ยมชมเว็บไซต์ PHP มักจะทำงานบนระบบ Windows หรือ Macintosh เว็บไซต์ที่ออกแบบมาเพื่ออัปโหลดไฟล์ Microsoft Word จากผู้ใช้เหล่านี้อาจจำเป็นต้องแยกเนื้อหาของไฟล์นี้และส่งอีเมลหรือประมวลผลข้อความโดยใช้อัลกอริธึม PHP แต่ไฟล์ Microsoft Word ซึ่งลงท้ายด้วยนามสกุล DOC ไม่ใช่ไฟล์ดั้งเดิมของ Linux หรือ PHP การเชื่อมโยงสภาพแวดล้อมของคอมพิวเตอร์ทั้งสองนี้เป็นไปได้ด้วยการเตรียมการบางอย่าง

ขั้นตอนที่ 1

ตรวจสอบกับผู้ให้บริการโฮสต์ของคุณว่าสามารถเข้าถึง PHP ได้สำหรับเว็บไซต์ของคุณ เซิร์ฟเวอร์ส่วนใหญ่รองรับ PHP แต่บางครั้งบริการนี้จำเป็นต้องมีการอัปเกรดบัญชี คุณไม่สามารถอ่านไฟล์ DOC โดยใช้ PHP ได้หากไม่มีการเข้าถึงคอมไพเลอร์

ขั้นตอนที่ 2

ดาวน์โหลดยูทิลิตี้ตัวอ่านเอกสาร Antiword MS Word (ดูเอกสารอ้างอิง) โปรแกรมโอเพนซอร์ซนี้มีสื่อการเขียนโปรแกรมที่ขยาย PHP สำหรับการแปลง DOC

ขั้นตอนที่ 3

เปิดเครื่องรูดไฟล์ Antiword เพื่อแยกเนื้อหา

ขั้นตอนที่ 4

อัปโหลดไลบรารีไฟล์ Antiword ทั้งหมดไปยังเว็บเซิร์ฟเวอร์ วางไฟล์ในไดเร็กทอรี "bin" ของบัญชีโฮสต์ ไดเร็กทอรีนี้เป็นที่เก็บทั่วไปสำหรับยูทิลิตี้และการดำเนินการไบนารีอื่นๆ ที่ผู้ใช้เว็บเซิร์ฟเวอร์ต้องใช้ประโยชน์บ่อยครั้ง

ขั้นตอนที่ 5

เรียกใช้โปรแกรม Antiword ในสคริปต์ PHP ที่ออกแบบมาเพื่ออ่านเอกสาร DOC Microsoft Word คำสั่งดำเนินการโดยใช้ฟังก์ชันเดียว พิมพ์ "$content = shell_exec('/usr/local/bin/antiword '.$filename);" โดยที่ "$filename" เท่ากับชื่อไฟล์เต็มของเอกสาร DOC เนื้อหาของไฟล์ DOC จะถูกอ่านเป็นตัวแปร "$content" ชื่อตัวแปรเหล่านี้ ซึ่งขึ้นต้นด้วยสัญลักษณ์ "$" สามารถปรับแต่งได้

ประมวลผลตัวแปร "$content" ตามต้องการเพื่อจัดการเนื้อหาของไฟล์ DOC เมื่อ PHP อ่าน DOC แล้ว ข้อความแบบเต็มของไฟล์จะพร้อมใช้งานสำหรับกิจกรรมเพิ่มเติมทุกรูปแบบ เนื้อหาสามารถส่งอีเมลหรือจัดเก็บไปยังฐานข้อมูลได้ เป็นต้น