บทที่ 4 โครงสร้างพื้นฐานด้านเทคโนโลยีสารสนเทศ
ฐานข้อมูลและระบบสารสนเทศ
ความหมายการจัดการฐานข้อมูล
ข้อมูล (Data) เป็นทรัพยากรสำคัญที่จำเป็นในการจัดการเหมือนกับทรัพย์สินอื่นๆของธุรกิจ
องค์กรส่วนใหญ่จะไม่สามารถอยู่รอดหรือประสบความสำเร็จได้หากปราศจากข้อมูลที่มีคุณภาพ
(Quality Data) เพื่อการดำเนินกิจการภายในและที่เกี่ยวข้องกับสิ่งแวดล้อมภายนอก
องค์กรอยู่ภายใต้ภาวะความกดดันอย่างมากในการเตรียมสารสนเทศที่มีคุณภาพสำหรับช่วยในการตัดสินใจให้อยู่ในรูปแบบที่ง่ายต่อการเข้าถึงและนำมาใช้งาน
ผู้ใช้จึงจำเป็นต้องมีสารสนเทศที่ดีเพื่อการปฏิบัติงานในหน้าที่อันวิกฤตของพวกเขาอันเนื่องจากการเปลี่ยนแปลงที่เกิดขึ้นอย่างรวดเร็ว
การแข่งขันด้านการตลาดที่เพิ่มขึ้น และวงจรชีวิตของผลิตภัณฑ์ที่สั้นลง นี่คือเหตุผลที่องค์กรและผู้จัดการจำเป็นต้องฝึกฝนการจัดการทรัพยากรข้อมูล
(Data Resource Management) โดยใช้เทคโนโลยีระบบสารสนเทศ เช่น การจัดการฐานข้อมูล (Data
Management) รวมถึงเครื่องมือการจัดการอื่นๆ
เพื่อจัดการทรัพยากรข้อมูลขององค์กรให้ตรงกับความต้องการของผู้ใช้
บทนี้จะแสดงให้เห็นถึงความเกี่ยวพันของการใช้เทคโนโลยีจัดการฐานข้อมูลและวิธีการในการจัดการทรัพย์สินข้อมูลขององค์กร
เพื่อให้สอดคล้องกับความต้องการสารสนเทศของธุรกิจ
- ระบบข้อมูลที่มีประสิทธิภาพช่วยให้ผู้ใช้มีข้อมูลที่ถูกต้องทันเวลาและมีความเกี่ยวข้อง
- ข้อมูลที่ถูกต้องปราศจากข้อผิดพลาด
- ข้อมูลทันเวลาสามารถใช้ได้กับผู้มีอำนาจตัดสินใจเมื่อมีความจำเป็น
- ข้อมูลที่เกี่ยวข้องมีความเกี่ยวข้องเมื่อเป็นประโยชน์และเหมาะสมกับประเภทของงานและการตัดสินใจที่จำเป็นต้องใช้
ความรู้เบื้องต้นเกี่ยวกับระบบฐานข้อมูล(Database System Concepts)
File Organization
concepts เรียงลำดับจากเล็กสุดไปใหญ่สุด
- Bit แสดงให้เห็นหน่วยที่เล็กที่สุดของข้อมูล 0 (off),1 (on)
- Byte คือ bit รวมกัน 2 ตัวขึ้นไปกลายเป็นอักขระ ตัวอักษร ตัวเลข symbol
- Field เขตข้อมูล คือ
ตัวอักษรตั้งแต่ 2 ตัวขึ้นไปรวมกันกลายเป็นคำที่มีความหมาย เช่น ชื่อ , ที่อยู่ , สิ่งของ , อายุ
- Record ระเบียน คือ การรวมของ Field กลายเป็นเรื่องๆหนึ่ง
- File แฟ้มข้อมูล คือ
กลุ่มข้อมูลที่เก็บรายการที่เกี่ยวข้องกัน อ้างอิงเรื่องเดียวกันนำรวมกัน อาทิเช่น
ตารางข้อมูลนักศึกษา, ตารางข้อมูลอาจารย์/เจ้าหน้าที่, ตารางข้อมูลอาคาร/สถานที่, ตารางข้อมูลการจัดตารางการสอน
- ฐานข้อมูล (Database) คือ
แหล่งจัดเก็บและรวบรวมกลุ่มข้อมูลที่เกี่ยวข้องกัน สัมพันธ์กัน
เป็นส่วนของข้อมูลที่อยู่ในองค์กรในระบบเดียวกัน
ปัญหาที่เกิดขึ้นจากระบบแฟ้มข้อมูล
1.data redundancy : โปรแกรมประยุกต์และแฟ้มข้อมูลถูกสร้างขึ้นมาโดยโปรแกรมเมอร์คนละคนในช่วงเวลาหนึ่งซึ่งนานแล้ว
ทำให้ข้อมูลเดียวกันอาจถูกเก็บอยู่ในหลายแฟ้มข้อมูล ตัวอย่างเช่น
แต่ละแฟ้มข้อมูลจะเก็บ Record ที่เกี่ยวกับลูกค้าเอาไว้
ซึ่งอาจมีข้อมูลของลูกค้า บาง Record ในจำนวนนี้ถูกเก็บไว้ในแฟ้มข้อมูลอื่นๆ
อีกก็ได้ ด้วยเหตุนี้
เมื่อมีการสรุปข้อมูลรายละเอียดของลูกค้าออกมาก็จะการแสดงข้อมูลของลูกค้าบางรายที่ซ้ำกันแสดงออกมาพร้อมๆ
กัน ซึ่งการเก็บข้อมูลแบบนี้ทำให้เปลืองเนื้อที่ในการเก็บข้อมูลโดยเปล่าประโยชน์,
สูญเสียเวลาของลูกค้า และ
เสียเวลาของเสมียนในการที่จะกรอกและแก้ไขข้อมูลของลูกค้า
2.data
redundancy: จะนำไปสู่การเกิด data inconsistency. Data
inconsistencyหมายถึง
ค่าจริงๆของข้อมูลมีการเก็บอยู่ในหลายๆที่ ซึ่งค่าเหล่านี้อาจจะไม่ตรงกันก็ได้
ทั้งที่ความจริงแล้วเป็นค่าเดียวกันหรืออาจไม่มีการนำข้อมูลเหล่านั้นมาเทียบกันเพื่อให้ตรงกัน
ตัวอย่างเช่น ถ้ามีนักเรียนเปลี่ยนที่อยู่, ที่อยู่ใหม่จะต้องถูกแก้ไขในทุกๆโปรแกรมในมหาวิทยาลัยที่จำเป็นต้องใช้ข้อมูลที่อยู่นี้
-โครงสร้างข้อมูลแบบไฟล์ทำให้ในการเข้าถึงข้อมูลจากโปรแกรมประยุกต์ที่แตกต่างกันทำได้ยาก
ซึ่งปัญหานี้เรียกว่า data isolation. สำหรับโปรแกรมประยุกต์ที่มีการออกแบบและพัฒนาแบบเดี่ยวๆนี้
แฟ้มข้อมูลจะมีโครงสร้างที่แตกต่างกัน,มีการจัดเก็บในรูปแบบที่แตกต่างกัน (เช่น
ความสูงที่วัดในหน่วยนิ้ว กับ ที่วัดในหน่วยเซนติเมตร) และบ่อยครั้งที่โปรแกรมประยุกต์อื่น
ไม่สามารถเข้าถึงได้ เช่น
ผู้จัดการต้องการรู้ลูกค้าซื้อผลิตภัณฑ์อะไรไปและลูกค้าคนไหนที่เป็นลูกหนี้ในระบบลูกหนี้
ซึ่งส่วนใหญ่น่าจะไม่สามารถหาคำตอบได้จากคอมพิวเตอร์ที่เป็นระบบแฟ้มข้อมูล.
ซึ่งผู้จัดการที่ต้องการทราบข้อมูลนี้อาจต้องมีการทำเอง คือ
พิมพ์ข้อมูลจากแฟ้มข้อมูลสองแฟ้มแล้วนำมาเปรียบเทียบกันเอง
ซึ่งขั้นตอนนี้จะเป็นการเสียเวลาและต้องใช้ความพยายามอย่างมากและคงจะดูเหมือนว่ามีการใช้ความสามารถของคอมพิวเตอร์ในด้านการประมวลผลที่ความเร็วและถูกต้องได้ไม่คุ้มค่าเท่าใดนัก
-ในระบบแฟ้มข้อมูลนั้นจะใช้ข้อบังคับต่างๆด้านความปลอดภัยนั้นทำได้ยาก
เพราะอาจจะมีโปรแกรมประยุกต์ใหม่ๆ
ที่เป็นลักษณะโปรแกรมเฉพาะกิจเพิ่มเติมเข้ามาในระบบ
ซึ่งทำให้ข้อมูลถูกเข้าถึงจากหลายโปรแกรมประยุกต์และหลายผู้ใช้งาน
-ระบบแฟ้มข้อมูลอาจจะเป็นสาเหตุของปัญหา data integrity เป็นอันหนึ่งอันเดียวกันของข้อมูล)
ค่าของข้อมูลจะต้องอยู่ภายใต้ข้อบังคับในด้านความเป็นอันหนึ่งอันเดียวกัน (integrity) ตัวอย่างเช่น
ฟิลด์ student’s social number (รหัสนักศึกษา)
จะไม่ยอมให้ใส่ค่าตัวอักขระ และ เกรดเฉลี่ยไม่สามารถเป็นค่าติดลบได้
ซึ่งการที่จะตั้งข้อบังคับเช่นนี้ทำได้ลำบากในการกำหนดข้อบังคับข้ามไปยังไฟล์ต่างๆ
หลายๆไฟล์
-ยิ่งกว่านั้นการแบ่งปันแฟ้มข้อมูลในระบบแฟ้มข้อมูล
(shared file environment) อาจทำให้เกิดปัญหาการเข้าใช้งานในเวลาเดียวกัน
(concurrency) โดยในขณะที่
โปรแกรมตัวหนึ่งกำลังปรับปรุงข้อมูลอยู่นั้น อีกโปรแกรมหนึ่งก็อาจจะกำลังเข้าถึง record ที่ถูกปรับปรุงอยู่, ผลที่เกิดขึ้นจากเหตุการณ์นี้คือโปรแกรมสองโปรแกรมอาจไม่ได้ข้อมูลตามที่ต้องการจะได้
-ท้ายที่สุดแล้ว
โปรแกรมก็จะพัฒนาไปโดยที่ไม่ได้คำนึงถึงการจัดเก็บข้อมูลของระบบ, โปรแกรมและข้อมูลในระบบคอมพิวเตอร์ก็จะเกิดการที่
โปรแกรมและข้อมูลแยกกันอยู่อย่างอิสระ ในระบบแฟ้มข้อมูลนั้น
โปรแกรมและข้อมูลที่เกี่ยวข้องกับโปรแกรมนั้นๆจะขึ้นอยู่กับสิ่งอื่น
ไม่ได้ขึ้นอยู่ซึ่งกันและกัน
-การเก็บข้อมูลในแฟ้มข้อมูลที่มีความเกี่ยวข้องกันกับโปรแกรมประยุกต์อย่างมาก
ซึ่งท้ายที่สุดแล้วจะทำให้องค์กรมีโปรแกรมประยุกต์เป็นและแฟ้มข้อมูลเป็นร้อย.
โดยที่ไม่มีศูนย์กลางที่จะแสดงรายละเอียดของแฟ้มข้อมูลที่มี, ส่วนของข้อมูลย่อย
หรือคำนิยามของข้อมูล.
ปัญหาหลายๆอย่างที่เกิดจากระบบแฟ้มข้อมูลทำให้นำไปสู่การพัฒนาของระบบ ฐานข้อมูล (database)
•การใช้วิธีการดั้งเดิมในการประมวลผลไฟล์จะช่วยส่งเสริมให้แต่ละพื้นที่ทำงานใน บริษัท พัฒนาโปรแกรมเฉพาะขึ้น แต่ละแอ็พพลิเคชันต้องการไฟล์ข้อมูลที่ไม่ซ้ำกันซึ่งจะนำไปสู่ความซ้ำซ้อนของข้อมูลและความไม่ลงรอยกันการประมวลผลความไม่ยืดหยุ่นและการสูญเสียทรัพยากรที่จัดเก็บ
DBMS ย่อมาจาก Database Management System
คือ ระบบการจัดการฐานข้อมูล
หรือซอฟต์แวร์ที่ดูแลจัดการเกี่ยวกับฐานข้อมูล
โดยอำนวยความสะดวกให้แก่ผู้ใช้ทั้งในด้านการสร้าง การปรับปรุงแก้ไข
การเข้าถึงข้อมูล
และการจัดการเกี่ยวกับระบบแฟ้มข้อมูลทางกายภาพ
ภายในฐานข้อมูลซึ่งต่างไปจากระบบแฟ้มข้อมูลคือ
หน้าที่เหล่านี้จะเป็นของโปรแกรมเมอร์
ในการติดต่อฐานข้อมูลไม่ว่าจะด้วยการใช้คำสั่งในกลุ่ม DML หรือ DDL หรือ จะด้วยโปรแกรมต่างๆ ทุกคำสั่งที่ใช้กระทำกับฐานข้อมูลจะถูกโปรแกรม
DBMS นำมาแปล (Compile) เป็นการกระทำต่างๆภายใต้คำสั่งนั้นๆ
เพื่อนำไปกระทำกับตัวข้อมูลใน ฐานข้อมูลต่อไป
หน้าที่ของ DBMS
1.)
ทำหน้าที่แปลงคำสั่งที่ใช้จัดการกับข้อมูลภายในฐานข้อมูลให้อยู่ในรูปแบบที่ข้อมูลเข้าใจ
2.)
ทำหน้าที่ในการนำคำสั่งต่างๆ
ซึ่งได้รับการแปลแล้วไปสั่งให้ฐานข้อมูลทำงาน เช่น การเรียกใช้ข้อมูล (Retrieve) การจัดเก็บข้อมูล
(Update) การลบข้อมูล (Delete) หรือ
การเพิ่มข้อมูลเป็นต้น (Add) ฯลฯ
3.)
ทำหน้าที่ป้องกันความเสียหายที่จะเกิดขึ้นกับข้อมูลภายในฐานข้อมูล
โดยจะคอยตรวจสอบว่าคำสั่งใดที่สามารถทำงานได้และคำสั่งใดที่ไม่สามารถทำได้
4.)
ทำหน้าที่รักษาความสัมพันธ์ของข้อมูลภายในฐานข้อมูลให้มีความถูกต้องอยู่เสมอ
5.)
ทำหน้าที่เก็บรายละเอียดต่าง
ๆ ที่เกี่ยวข้องกับข้อมูลภายในฐานข้อมูลไว้ใน data dictionary ซึ่งรายละเอียดเหล่านี้มักจะถูกเรียกว่า
"ข้อมูลของข้อมูล" (Meta Data)
6.)
ทำหน้าที่ควบคุมให้ฐานข้อมูลทำงานได้อย่างถูกต้องและมีประสิทธิภาพ
ฐานข้อมูลเชิงสัมพันธ์
หมายความว่า จะมีการจัดเก็บข้อมูลในลักษณะที่เป็นกลุ่มของข้อมูลที่มีความสัมพันธ์กัน ในฐานข้อมูลหนึ่งๆ สามารถที่จะมีตารางตั้งแต่ 1 ตารางเป็นต้นไป และในแต่ละตารางนั้นก็สามารถมีได้หลายคอลัมน์ (Column) หลายแถว (Row) ตัวอย่างเช่น เราต้องการเก็บข้อมูลพนักงาน ในตารางของข้อมูลพนักงานก็จะประกอบด้วยคอลัมน์ ที่อธิบายชื่อ นามสกุล ที่อยู่ เงินเดือน แผนกที่สังกัด เป็นต้น และในตารางนั้น ก็สามารถที่จะมีข้อมูลพนักงานได้มากกว่า 1 คน (Row) และตารางข้อมูลพนักงานนั้นอาจจะมีความสัมพันธ์กับตารางอื่น เช่น ตารางที่เก็บชื่อและจำนวนบุตรของพนักงาน
ฐานข้อมูลเชิงสัมพันธ์ถูกออกแบบมาเพื่อลดความซ้ำซ้อนของการเก็บข้อมูล และสามารถเรียกใช้ข้อมูลได้อย่างมีประสิทธิภาพ โดยมีหลักดังนี้
- ตารางจะต้องมีชื่อไม่ซ้ำกัน
- แต่ละฟิลด์จะบรรจะประเภทข้อมูลเพียงชนิดเดียวเท่านั้นแน่นอน
- ข้อมูลในแต่ละเรคอร์ดจะต้องไม่ซ้ำกัน
นอกจากนี้แต่ละตารางยังสามารถเริยกได้อีกอย่างว่ารีเลชัน (Relation) แถวแต่ละแถวภายในตารางเรียกว่าทูเปิล (Tuple) และคอลัมน์เรียกว่าแอททริบิวต์ (Attribute)
จุดเด่นของข้อมูลเชิงสัมพันธ์
- ง่ายต่อการเรียนรู้ และการนำไปใช้งาน ทำให้เห็นภาพข้อมูลชัดเจน
- ภาษาที่ใช้จัดการข้อมูลเป็นแบบซีเควล ซึ่งมีประสิทธิภาพสูงเข้าใจง่าย
- การออกแบบระบบมีทฤษฎีรองรับ สามารถลดความซ้ำซ้อนของข้อมูลได้
กฎที่เกี่ยวข้องกับคีย์ในฐานข้อมูลเชิงสัมพันธ์
1. กฎความบูรณภาพของเอนทิตี้ (The Entity Intergrity Rule)
กฎนี้ระบุไว้ว่าแอททริบิวต์ใดที่เป็นคีย์หลัก ข้อมูลในแอททริบิวต์นั้นจะเป็นค่าว่าง(Null) ไม่ได้ ความหมายของการเป็นค่าว่างไม่ได้(Not Null) หมายความถึง ข้อมูลของแอททริบิวต์ที่เป็นคีย์หลักจะไม่ทราบค่าที่แน่นอนหรือไม่มีค่าไม่ได้
2. กฎความบูรณภาพของการอ้างอิง (The Referential IntegrityRule)
การอ้างอิงข้อมูลระหว่างรีเลชั่นในฐานข้อมูลเชิงสัมพันธ์จะใช้คีย์นอกของรีเลชั่นหนึ่งไปตรวจสอบกับค่าของแอททริบิวต์ที่เป็นคีย์หลักของอีกรีเลชั่นหนึ่งเพื่อเรียกดูข้อมูลอื่นๆที่เกี่ยวข้องหรือค่าของคีย์นอกจะต้องอ้างอิงให้ตรงกับค่าของคีย์หลักได้จึงจะสามารถเชื่อมโยงข้อมูลระหว่างสองรีเลชั่นได้สำหรับคีย์นอกจะมีค่าว่างได้หรือไม่ขึ้นอยู่กับกฎเกณฑ์การออกแบบฐานข้อมูล เช่น ในกรณีที่รีเลชั่นพนักงานมี Depnoเป็นคีย์นอกอาจจะถูกระบุว่าต้องทราบค่าแต่ในกรณีพนักงานทดลองงานอาจยังไม่มีค่า Depno เพราะยังไม่ได้ถูกบรรจุในกรณีที่มีการลบหรือแก้ใขข้อมูลของแอททริบิวต์ที่เป็นคีย์หลักซึ่งมีคีย์นอก จากอีกรีเลชั่นหนึ่งอ้างอิงถึง จะทำการลบหรือแก้ใขข้อมูลได้หรือไม่ ขึ้นอยู่กับการออกแบบฐานข้อมูล ว่าได้ระบุให้แอททริบิวต์มีคุณสมบัติอย่างไร ซึ่งมีโอกาสเป็นไปได้ 4 ทางเลือก
1. การลบหรือแก้ไขข้อมูลแบบมีข้อจำกัด (Restrict) การลบหรือแก้ไขข้อมูลจะกระทำได้ เมื่อข้อมูลของคีย์หลักในรีเลชั่นหนึ่งไม่มีข้อมูลที่ถูกอ้างอิง โดยคีย์นอกของอีกรีเลชั่นหนึ่งเช่น รหัสแผนก Depno ในรีเลชั่นDepจะถูกแก้ใขหรือลบทิ้งต่อเมื่อไม่มีพนักงานคนใดสังกัดอยู่ในแผนกนั้น
2.การลบหรือแก้ไขข้อมูลแบบต่อเรียง (Cascade) การลบหรือการแก้ใขข้อมูล จะทำแบบเป็นลูกโซ่ คือ หากมีการแก้ไขหรือลบข้อมูลของคีย์หลักในรีเลชั่นหนึ่งระบบจะทำการลบหรือแก้ใขข้อมูลของคีย์นอกในอีกรีเลชั่นหนึ่งที่อ้างอิงถึงข้อมูลของคีย์หลักที่ถูกลบให้ด้วย เช่น ในกรณีที่ยกเลิกแผนก 9 ในEntityแผนก ข้อมูลของพนักงานที่อยู่แผนก 10 ในEntityพนักงานจะถูกลบออกไปด้วย
3.การลบหรือแก้ไขข้อมูลโดยเปลี่ยนเป็นค่าว่าง (Nullify) การลบหรือแก้ใขข้อมูลจะทำได้เมื่อมีการเปลี่ยนค่าของคีย์นอกในข้อมูลที่ถูกอ้างอิงให้เป็นค่าว่างเสียก่อน เช่น พนักงานที่อยู่ในแผนกที่ 9 จะถูกเปลี่ยนค่าเป็นค่าว่างก่อนหลังจากนั้น การลบข้อมูลของแผนกที่มีรหัส 9 จะถูกลบทิ้งหรือแก้ไขทันที ภายใน Entity แผนก
4.การลบหรือแก้ไขข้อมูลแบบใช้ค่าโดยปริยาย ( Default) การลบหรือแก้ไขข้อมูลของคีย์หลัก สามารถทำได้โดยถ้าหากมีคีย์นอกที่อ้างอิงถึงคีย์หลักที่ถูกลบหรือแก้ไข ก็จะทำการปรับค่าของคีย์นอกนั้นโดยปริยาย (Default Value) ที่ถูกกำหนดขึ้นเช่น ในกรณีที่ยกเลิกแผนก 9 ในEntity แผนก ข้อมูลของพนักงานที่อยู่แผนก 9 ใน Entity พนักงานจะถูกเปลี่ยนค่าเป็น 00 ซึ่งเป็นค่าโดยปริยาย ที่หมายความว่า ไม่ได้สังกัดแผนกใด ไม่เข้าใจกลับไปอ่านใหม่
ฐานข้อมูลและฐานข้อมูลที่ไม่ใช่ฐานข้อมูลในระบบคลาวด์ ระบบการจัดการฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์ใช้รูปแบบข้อมูลที่มีความยืดหยุ่นมากขึ้นและได้รับการออกแบบมาสำหรับการจัดการชุดข้อมูลขนาดใหญ่ในเครื่องที่มีการแจกจ่ายหลายเครื่องและสามารถปรับขนาดได้ง่ายขึ้นหรือลดลงซึ่งจะเป็นประโยชน์สำหรับการเร่งแบบสอบถามที่ง่ายต่อข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างรวมถึงWeb สื่อสังคมกราฟิกและข้อมูลรูปแบบอื่น ๆ ที่ยากต่อการวิเคราะห์ด้วยเครื่องมือ SQL แบบดั้งเดิม บริการจัดการข้อมูลบนระบบคลาวด์มีการอุทธรณ์เป็นพิเศษสำหรับการเริ่มต้นระบบที่เน้นการทำงานแบบออนไลน์หรือธุรกิจขนาดเล็กถึงขนาดกลางที่แสวงหาขีดความสามารถด้านฐานข้อมูลในราคาที่ต่ำกว่าผลิตภัณฑ์ฐานข้อมูลภายใน
การบริหารฐานข้อมูล ในระบบฐานข้อมูลนอกจากจะมีระบบการจัดการฐานข้อมูล ซึ่งเป็นซอฟต์แวร์ที่สร้างขึ้นเพื่อจัดการกับฐานข้อมูลให้เป็นระบบ จะได้นำไปเก็บรักษาเรียกใช้หรือนำมาปรับปรุงให้ทันสมัยได้ง่ายแล้ว ในระบบฐานข้อมูลยังต้องประกอบด้วยบุคคลทีมีหน้าที่ควบคุมดูแลระบบฐานข้อมูล คือ ผู้บริหารฐานข้อมูล ความสำคัญของการจัดการฐานข้อมูลก็คือ การมีศูนย์กลางควบคุมทั้งข้อมูลและโปรแกรมที่เข้าถึงข้อมูลเหล่านั้น บุคคลที่มีอำนาจหน้าที่ดูแลการควบคุมนี้ เรียกว่า ผู้บริหารฐานข้อมูลหรือ DBA (Data Base Administor)
หน้าที่ของผู้บริหารฐานข้อมูล 1. กำหนดโครงสร้างหรือรูปแบบของฐานข้อมูล โดยทำการวิเคราะห์และตัดสินใจว่าจะรวมข้อมูลใดเข้าไว้ในระบบใดบ้าง ควรจะจัดเก็บข้อมูลด้วยวิธีใดและใช้เทคนิคใดในการเรียกใช้ข้อมูลอย่างไร 2. กำหนดโครงสร้างของอุปกรณ์เก็บข้อมูลและวิธีการเข้าถึงข้อมูล โดยกำหนดโครงสร้างของอุปกรณ์เก็บข้อมูลและวิธีการเข้าถึงข้อมูลพร้อมทั้งกำหนดแผนการในการสร้างระบบข้อมูลสำรองและการฟื้นสภาพ โดยการจัดเก็บข้อมูลสำรองไว้ทุกระยะ และจะต้องเตรียมการไว้ว่าถ้าเกิดความผิดพลาดขึ้นแล้วจะทำการฟื้นสภาพได้อย่างไร
3.มอบหมายขอบเขตอำนาจหน้าที่ของการเข้าถึงข้อมูลของผู้ใช้ โดยการประสานงานกับผู้ใช้ ให้คำปรึกษา ให้ความช่วยเหลือแก่ผู้ใช้ และตรวจตรา
การออกแบบระบบฐานข้อมูล ฐานข้อมูลจำเป็นต้องใช้ทั้งการออกแบบแนวคิดและการออกแบบทางกายภาพการออกแบบฐานข้อมูลเป็นแนวคิดเชิงแนวคิดหรือตรรกะเป็นรูปแบบนามธรรมของฐานข้อมูลจากมุมมองทางธุรกิจในขณะที่การออกแบบทางกายภาพแสดงให้เห็นว่าฐานข้อมูลเป็นจริงในการจัดเก็บข้อมูลแบบตรงอย่างไร การสร้างแบบจำลองเป็นกระบวนการสร้างโครงสร้างข้อมูลขนาดเล็กเสถียรและมีความยืดหยุ่นและปรับตัวได้จากกลุ่มข้อมูลที่ซับซ้อนเรียกว่า แผนผังความสัมพันธ์เอนทิตี (ERD) เป็นแบบข้อมูลที่นักออกแบบฐานข้อมูลจัดทำเอกสารรูปแบบข้อมูลของตนแผนผัง ER แสดงความสัมพันธ์ระหว่างหน่วยงานในฐานข้อมูล
Big data
คือ ข้อมูลที่ประกอบด้วยคุณลักษณะ 4 อย่างคือ
1.Volume — size ของข้อมูลมีขนาดใหญ่ มีปริมาณข้อมูลมาก ซึ่งสามารถเป็นได้ทั้งข้อมูลแบบ offline หรือ online
2.Variety — ข้อมูลมีความหลากหลาย สามารถเป็นได้ทั้งที่มีโครงสร้างและข้อมูลที่ไม่สามารถจับ pattern ได้
3.Velocity — ข้อมูลมีการเปลี่ยนแปลงตลอดเวลาอย่างรวดเร็ว มีการส่งผ่านข้อมูลอย่างต่อเนื่องในลักษณะ streaming ทำให้การวิเคราะห์ข้อมูลแบบ manual มีข้อจำกัด
4.Veracity — ข้อมูลมีความไม่ชัดเจน (untrusted, uncleaned)
โดยรูปแบบของข้อมูลของ big data ก็สามารถเป็นไปได้หลากหลาย ตั้งแต่
1. Behavioral data: ข้อมูลเชิงพฤติกรรมการใช้งานต่างๆเช่น server log, พฤติกรรมการคลิกดูข้อมูล, ข้อมูลการใช้ ATM เป็นต้น
2.Image & sounds: ภาพถ่าย, วีดีโอ, รูปจาก google street view, ภาพถ่ายทางการแพทย์, ลายมือ, ข้อมูลเสียงที่ถูกบันทึกไว้ เป็นต้น
3.Languages: text message, ข้อความที่ถูก tweet, เนื้อหาต่างๆในเว็บไซต์ เป็นต้น
4.Records: ข้อมูลทางการแพทย์, ข้อมูลผลสำรวจที่มีขนาดใหญ่, ข้อมูลทางภาษี เป็นต้น
5.Sensors: ข้อมูลอุณหภูมิ, accelerometer, ข้อมูลทางภูมิศาสตร์
โครงสร้างความคิดทางธุรกิจ
•คลังข้อมูล เป็นฐานข้อมูลที่เก็บข้อมูลปัจจุบันและข้อมูลทางประวัติศาสตร์ที่น่าสนใจสำหรับผู้มีอำนาจตัดสินใจทั่วทั้ง บริษัท คลังข้อมูลจะดึงข้อมูลปัจจุบันและข้อมูลทางประวัติศาสตร์จากระบบปฏิบัติการหลายระบบและปรับโครงสร้างข้อมูลเพื่อการรายงานและการวิเคราะห์ด้านการจัดการ
• Hadoop เป็นกรอบซอฟต์แวร์ซอฟต์แวร์โอเพนซอร์สซึ่งได้รับการจัดการโดยมูลนิธิซอฟต์แวร์อะเพดซึ่งช่วยให้สามารถประมวลผลข้อมูลแบบขนานได้อย่างมากในคอมพิวเตอร์ที่มีราคาไม่แพง แบ่งปัญหาข้อมูลขนาดใหญ่ออกเป็นปัญหาย่อยกระจายไปยังโหนดประมวลผลคอมพิวเตอร์ที่มีราคาไม่แพงนับพันรายการและรวมผลลัพธ์ไว้ในชุดข้อมูลขนาดเล็กที่สามารถวิเคราะห์ได้ง่ายขึ้น
•หน่วยความจำในคอมพิวเตอร์ การประมวลผลในหน่วยความจำทำให้ชุดข้อมูลจำนวนมากมีขนาดใหญ่พอสมควรกับขนาดของข้อมูลหรือคลังข้อมูลขนาดเล็กเพื่อให้อยู่ในหน่วยความจำทั้งหมดการคำนวณทางธุรกิจแบบซับซ้อนที่ใช้เวลาหลายชั่วโมงหรือวันสามารถทำได้ภายในไม่กี่วินาทีและสามารถทำได้แม้กระทั่งบนอุปกรณ์มือถือ
การวิเคราะห์ความสัมพันธ์
1.Online Analytical Processing (OLAP) คือเทคโนโลยีที่ใช้ในการจัดระเบียบฐานข้อมูลธุรกิจขนาดใหญ่และสนับสนุนข่าวกรองธุรกิจ ฐานข้อมูล OLAP แบ่งออกเป็นคิวบ์หนึ่งคิวบ์ขึ้นไป และแต่ละคิวบ์มีการจัดระเบียบและออกแบบโดยผู้ดูแลคิวบ์เพื่อให้เหมาะกับวิธีที่คุณเรียกใช้และวิเคราะห์ข้อมูล เพื่อให้สามารถสร้างและใช้รายงาน PivotTable และรายงาน PivotChart ที่คุณต้องการได้ง่าย
2.การทําเหมืองข้อมูล (Data Mining) คือกระบวนการที่กระทํากับข้อมูลจํานวนมากเพื่อค้นหารูปแบบและความสัมพันธ์ ที่ซ่อนอยู่ในชุดข้อมูลนั้น ในปัจจุบันการทําเหมืองข้อมูลได้ถูกนําไปประยุกต์ใช้ในงานหลายประเภท ทั้งในด้านธุรกิจที่ช่วยในการตัดสินใจของผู้บริหาร ในด้านวิทยาศาสตร์และการแพทย์รวมทั้งในด้านเศรษฐกิจและสังคม
3.การทำเหมืองข้อความ (text mining) หรืออาจจะเรียกว่า "การค้นหาความรู้ในฐานข้อมูลเอกสาร" (Knowledge Discovery in Document Databases) เป็นเทคนิคเพื่อค้นหารูปแบบ (pattern) ของจากข้อความจำนวนมหาศาลโดยอัตโนมัติ โดยใช้ขั้นตอนวิธีจากวิชาสถิติ การเรียนรู้ของเครื่อง และ การรู้จำแบบ หรือในอีกนิยามหนึ่ง การทำเหมืองข้อความ คือ กระบวนการที่กระทำกับข้อความ (โดยส่วนใหญ่จะมีจำนวนมาก) เพื่อค้นหารูปแบบ แนวทาง และความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อความนั้น โดยอาศัยหลักสถิติ การรู้จำ การเรียนรู้ของเครื่อง หลักคณิตศาสตร์ หลักการประมวลเอกสาร (Document Processing) หลักการประมวลผลข้อความ (Text Processing) และหลักการประมวลผลภาษาธรรมชาติ (Natural Language Processing)
เว็บไซต์และฐานข้อมูล
ในสภาพแวดล้อมแบบไคลเอ็นต์ / เซิร์ฟเวอร์ DBMS อยู่บนคอมพิวเตอร์เฉพาะที่เรียกว่าเซิร์ฟเวอร์ฐานข้อมูล DBMS จะรับคำขอ SQL และให้ข้อมูลที่จำเป็น มิดเดิลแวร์ส่งข้อมูลจากฐานข้อมูลภายในขององค์กรกลับไปยังเว็บเซิร์ฟเวอร์เพื่อส่งมอบในรูปแบบของเว็บเพจให้กับผู้ใช้
1. การลบหรือแก้ไขข้อมูลแบบมีข้อจำกัด (Restrict) การลบหรือแก้ไขข้อมูลจะกระทำได้ เมื่อข้อมูลของคีย์หลักในรีเลชั่นหนึ่งไม่มีข้อมูลที่ถูกอ้างอิง โดยคีย์นอกของอีกรีเลชั่นหนึ่งเช่น รหัสแผนก Depno ในรีเลชั่นDepจะถูกแก้ใขหรือลบทิ้งต่อเมื่อไม่มีพนักงานคนใดสังกัดอยู่ในแผนกนั้น
2.การลบหรือแก้ไขข้อมูลแบบต่อเรียง (Cascade) การลบหรือการแก้ใขข้อมูล จะทำแบบเป็นลูกโซ่ คือ หากมีการแก้ไขหรือลบข้อมูลของคีย์หลักในรีเลชั่นหนึ่งระบบจะทำการลบหรือแก้ใขข้อมูลของคีย์นอกในอีกรีเลชั่นหนึ่งที่อ้างอิงถึงข้อมูลของคีย์หลักที่ถูกลบให้ด้วย เช่น ในกรณีที่ยกเลิกแผนก 9 ในEntityแผนก ข้อมูลของพนักงานที่อยู่แผนก 10 ในEntityพนักงานจะถูกลบออกไปด้วย
3.การลบหรือแก้ไขข้อมูลโดยเปลี่ยนเป็นค่าว่าง (Nullify) การลบหรือแก้ใขข้อมูลจะทำได้เมื่อมีการเปลี่ยนค่าของคีย์นอกในข้อมูลที่ถูกอ้างอิงให้เป็นค่าว่างเสียก่อน เช่น พนักงานที่อยู่ในแผนกที่ 9 จะถูกเปลี่ยนค่าเป็นค่าว่างก่อนหลังจากนั้น การลบข้อมูลของแผนกที่มีรหัส 9 จะถูกลบทิ้งหรือแก้ไขทันที ภายใน Entity แผนก
4.การลบหรือแก้ไขข้อมูลแบบใช้ค่าโดยปริยาย ( Default) การลบหรือแก้ไขข้อมูลของคีย์หลัก สามารถทำได้โดยถ้าหากมีคีย์นอกที่อ้างอิงถึงคีย์หลักที่ถูกลบหรือแก้ไข ก็จะทำการปรับค่าของคีย์นอกนั้นโดยปริยาย (Default Value) ที่ถูกกำหนดขึ้นเช่น ในกรณีที่ยกเลิกแผนก 9 ในEntity แผนก ข้อมูลของพนักงานที่อยู่แผนก 9 ใน Entity พนักงานจะถูกเปลี่ยนค่าเป็น 00 ซึ่งเป็นค่าโดยปริยาย ที่หมายความว่า ไม่ได้สังกัดแผนกใด ไม่เข้าใจกลับไปอ่านใหม่
ฐานข้อมูลและฐานข้อมูลที่ไม่ใช่ฐานข้อมูลในระบบคลาวด์ ระบบการจัดการฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์ใช้รูปแบบข้อมูลที่มีความยืดหยุ่นมากขึ้นและได้รับการออกแบบมาสำหรับการจัดการชุดข้อมูลขนาดใหญ่ในเครื่องที่มีการแจกจ่ายหลายเครื่องและสามารถปรับขนาดได้ง่ายขึ้นหรือลดลงซึ่งจะเป็นประโยชน์สำหรับการเร่งแบบสอบถามที่ง่ายต่อข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างรวมถึงWeb สื่อสังคมกราฟิกและข้อมูลรูปแบบอื่น ๆ ที่ยากต่อการวิเคราะห์ด้วยเครื่องมือ SQL แบบดั้งเดิม บริการจัดการข้อมูลบนระบบคลาวด์มีการอุทธรณ์เป็นพิเศษสำหรับการเริ่มต้นระบบที่เน้นการทำงานแบบออนไลน์หรือธุรกิจขนาดเล็กถึงขนาดกลางที่แสวงหาขีดความสามารถด้านฐานข้อมูลในราคาที่ต่ำกว่าผลิตภัณฑ์ฐานข้อมูลภายใน
การบริหารฐานข้อมูล ในระบบฐานข้อมูลนอกจากจะมีระบบการจัดการฐานข้อมูล ซึ่งเป็นซอฟต์แวร์ที่สร้างขึ้นเพื่อจัดการกับฐานข้อมูลให้เป็นระบบ จะได้นำไปเก็บรักษาเรียกใช้หรือนำมาปรับปรุงให้ทันสมัยได้ง่ายแล้ว ในระบบฐานข้อมูลยังต้องประกอบด้วยบุคคลทีมีหน้าที่ควบคุมดูแลระบบฐานข้อมูล คือ ผู้บริหารฐานข้อมูล ความสำคัญของการจัดการฐานข้อมูลก็คือ การมีศูนย์กลางควบคุมทั้งข้อมูลและโปรแกรมที่เข้าถึงข้อมูลเหล่านั้น บุคคลที่มีอำนาจหน้าที่ดูแลการควบคุมนี้ เรียกว่า ผู้บริหารฐานข้อมูลหรือ DBA (Data Base Administor)
หน้าที่ของผู้บริหารฐานข้อมูล 1. กำหนดโครงสร้างหรือรูปแบบของฐานข้อมูล โดยทำการวิเคราะห์และตัดสินใจว่าจะรวมข้อมูลใดเข้าไว้ในระบบใดบ้าง ควรจะจัดเก็บข้อมูลด้วยวิธีใดและใช้เทคนิคใดในการเรียกใช้ข้อมูลอย่างไร 2. กำหนดโครงสร้างของอุปกรณ์เก็บข้อมูลและวิธีการเข้าถึงข้อมูล โดยกำหนดโครงสร้างของอุปกรณ์เก็บข้อมูลและวิธีการเข้าถึงข้อมูลพร้อมทั้งกำหนดแผนการในการสร้างระบบข้อมูลสำรองและการฟื้นสภาพ โดยการจัดเก็บข้อมูลสำรองไว้ทุกระยะ และจะต้องเตรียมการไว้ว่าถ้าเกิดความผิดพลาดขึ้นแล้วจะทำการฟื้นสภาพได้อย่างไร
3.มอบหมายขอบเขตอำนาจหน้าที่ของการเข้าถึงข้อมูลของผู้ใช้ โดยการประสานงานกับผู้ใช้ ให้คำปรึกษา ให้ความช่วยเหลือแก่ผู้ใช้ และตรวจตรา
การออกแบบระบบฐานข้อมูล ฐานข้อมูลจำเป็นต้องใช้ทั้งการออกแบบแนวคิดและการออกแบบทางกายภาพการออกแบบฐานข้อมูลเป็นแนวคิดเชิงแนวคิดหรือตรรกะเป็นรูปแบบนามธรรมของฐานข้อมูลจากมุมมองทางธุรกิจในขณะที่การออกแบบทางกายภาพแสดงให้เห็นว่าฐานข้อมูลเป็นจริงในการจัดเก็บข้อมูลแบบตรงอย่างไร การสร้างแบบจำลองเป็นกระบวนการสร้างโครงสร้างข้อมูลขนาดเล็กเสถียรและมีความยืดหยุ่นและปรับตัวได้จากกลุ่มข้อมูลที่ซับซ้อนเรียกว่า แผนผังความสัมพันธ์เอนทิตี (ERD) เป็นแบบข้อมูลที่นักออกแบบฐานข้อมูลจัดทำเอกสารรูปแบบข้อมูลของตนแผนผัง ER แสดงความสัมพันธ์ระหว่างหน่วยงานในฐานข้อมูล
Big data
คือ ข้อมูลที่ประกอบด้วยคุณลักษณะ 4 อย่างคือ
1.Volume — size ของข้อมูลมีขนาดใหญ่ มีปริมาณข้อมูลมาก ซึ่งสามารถเป็นได้ทั้งข้อมูลแบบ offline หรือ online
2.Variety — ข้อมูลมีความหลากหลาย สามารถเป็นได้ทั้งที่มีโครงสร้างและข้อมูลที่ไม่สามารถจับ pattern ได้
3.Velocity — ข้อมูลมีการเปลี่ยนแปลงตลอดเวลาอย่างรวดเร็ว มีการส่งผ่านข้อมูลอย่างต่อเนื่องในลักษณะ streaming ทำให้การวิเคราะห์ข้อมูลแบบ manual มีข้อจำกัด
4.Veracity — ข้อมูลมีความไม่ชัดเจน (untrusted, uncleaned)
โดยรูปแบบของข้อมูลของ big data ก็สามารถเป็นไปได้หลากหลาย ตั้งแต่
1. Behavioral data: ข้อมูลเชิงพฤติกรรมการใช้งานต่างๆเช่น server log, พฤติกรรมการคลิกดูข้อมูล, ข้อมูลการใช้ ATM เป็นต้น
2.Image & sounds: ภาพถ่าย, วีดีโอ, รูปจาก google street view, ภาพถ่ายทางการแพทย์, ลายมือ, ข้อมูลเสียงที่ถูกบันทึกไว้ เป็นต้น
3.Languages: text message, ข้อความที่ถูก tweet, เนื้อหาต่างๆในเว็บไซต์ เป็นต้น
4.Records: ข้อมูลทางการแพทย์, ข้อมูลผลสำรวจที่มีขนาดใหญ่, ข้อมูลทางภาษี เป็นต้น
5.Sensors: ข้อมูลอุณหภูมิ, accelerometer, ข้อมูลทางภูมิศาสตร์
โครงสร้างความคิดทางธุรกิจ
•คลังข้อมูล เป็นฐานข้อมูลที่เก็บข้อมูลปัจจุบันและข้อมูลทางประวัติศาสตร์ที่น่าสนใจสำหรับผู้มีอำนาจตัดสินใจทั่วทั้ง บริษัท คลังข้อมูลจะดึงข้อมูลปัจจุบันและข้อมูลทางประวัติศาสตร์จากระบบปฏิบัติการหลายระบบและปรับโครงสร้างข้อมูลเพื่อการรายงานและการวิเคราะห์ด้านการจัดการ
• Hadoop เป็นกรอบซอฟต์แวร์ซอฟต์แวร์โอเพนซอร์สซึ่งได้รับการจัดการโดยมูลนิธิซอฟต์แวร์อะเพดซึ่งช่วยให้สามารถประมวลผลข้อมูลแบบขนานได้อย่างมากในคอมพิวเตอร์ที่มีราคาไม่แพง แบ่งปัญหาข้อมูลขนาดใหญ่ออกเป็นปัญหาย่อยกระจายไปยังโหนดประมวลผลคอมพิวเตอร์ที่มีราคาไม่แพงนับพันรายการและรวมผลลัพธ์ไว้ในชุดข้อมูลขนาดเล็กที่สามารถวิเคราะห์ได้ง่ายขึ้น
•หน่วยความจำในคอมพิวเตอร์ การประมวลผลในหน่วยความจำทำให้ชุดข้อมูลจำนวนมากมีขนาดใหญ่พอสมควรกับขนาดของข้อมูลหรือคลังข้อมูลขนาดเล็กเพื่อให้อยู่ในหน่วยความจำทั้งหมดการคำนวณทางธุรกิจแบบซับซ้อนที่ใช้เวลาหลายชั่วโมงหรือวันสามารถทำได้ภายในไม่กี่วินาทีและสามารถทำได้แม้กระทั่งบนอุปกรณ์มือถือ
การวิเคราะห์ความสัมพันธ์
1.Online Analytical Processing (OLAP) คือเทคโนโลยีที่ใช้ในการจัดระเบียบฐานข้อมูลธุรกิจขนาดใหญ่และสนับสนุนข่าวกรองธุรกิจ ฐานข้อมูล OLAP แบ่งออกเป็นคิวบ์หนึ่งคิวบ์ขึ้นไป และแต่ละคิวบ์มีการจัดระเบียบและออกแบบโดยผู้ดูแลคิวบ์เพื่อให้เหมาะกับวิธีที่คุณเรียกใช้และวิเคราะห์ข้อมูล เพื่อให้สามารถสร้างและใช้รายงาน PivotTable และรายงาน PivotChart ที่คุณต้องการได้ง่าย
2.การทําเหมืองข้อมูล (Data Mining) คือกระบวนการที่กระทํากับข้อมูลจํานวนมากเพื่อค้นหารูปแบบและความสัมพันธ์ ที่ซ่อนอยู่ในชุดข้อมูลนั้น ในปัจจุบันการทําเหมืองข้อมูลได้ถูกนําไปประยุกต์ใช้ในงานหลายประเภท ทั้งในด้านธุรกิจที่ช่วยในการตัดสินใจของผู้บริหาร ในด้านวิทยาศาสตร์และการแพทย์รวมทั้งในด้านเศรษฐกิจและสังคม
3.การทำเหมืองข้อความ (text mining) หรืออาจจะเรียกว่า "การค้นหาความรู้ในฐานข้อมูลเอกสาร" (Knowledge Discovery in Document Databases) เป็นเทคนิคเพื่อค้นหารูปแบบ (pattern) ของจากข้อความจำนวนมหาศาลโดยอัตโนมัติ โดยใช้ขั้นตอนวิธีจากวิชาสถิติ การเรียนรู้ของเครื่อง และ การรู้จำแบบ หรือในอีกนิยามหนึ่ง การทำเหมืองข้อความ คือ กระบวนการที่กระทำกับข้อความ (โดยส่วนใหญ่จะมีจำนวนมาก) เพื่อค้นหารูปแบบ แนวทาง และความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อความนั้น โดยอาศัยหลักสถิติ การรู้จำ การเรียนรู้ของเครื่อง หลักคณิตศาสตร์ หลักการประมวลเอกสาร (Document Processing) หลักการประมวลผลข้อความ (Text Processing) และหลักการประมวลผลภาษาธรรมชาติ (Natural Language Processing)
เว็บไซต์และฐานข้อมูล
ในสภาพแวดล้อมแบบไคลเอ็นต์ / เซิร์ฟเวอร์ DBMS อยู่บนคอมพิวเตอร์เฉพาะที่เรียกว่าเซิร์ฟเวอร์ฐานข้อมูล DBMS จะรับคำขอ SQL และให้ข้อมูลที่จำเป็น มิดเดิลแวร์ส่งข้อมูลจากฐานข้อมูลภายในขององค์กรกลับไปยังเว็บเซิร์ฟเวอร์เพื่อส่งมอบในรูปแบบของเว็บเพจให้กับผู้ใช้
ไม่มีความคิดเห็น:
แสดงความคิดเห็น