สรุปขั้นตอนการสำรวจข้อมูลเพื่อความเข้าใจในข้อมูลวันที่และเวลาที่ซ่อนอยู่ ด้วย SQL ตอนที่ 4 (จบ)

จากโพสต์ที่ผ่านมาทั้ง 3 บทได้สรุปถึงแนวคิด และ ขั้นตอนในการสำรวจข้อมูลที่เป็นตัวเลข ทั้งค่าตัวเลข ตัวอักษรและข้อความ รวมถึงการใช้คำสั่งที่จำเป็นต้องใช้และความสัมพันธ์ของข้อมูลต่างๆที่ นอกจากนี้ จะทำการสำรวจข้อมูลเหล่านี้ และใช้หลักการทางสถิติเพื่อเข้าใจข้อมูลเหล่านั้น

สำหรับโพสต์นี้จะเป็นการสำรวจข้อมูลที่เป็นวันที่และเวลา ซึ่งข้อมูลเหล่านี้ เป้าหมายในการสำรวจ จะนำไปหาความหมายด้วยหลักการทางสถิติด้วยวันที่ ส่วนใหญ่จะนำไปใช้กับเรื่อง Time series analysis จะทำวิธีการทางสถิติ อย่างเช่น การนับจำนวนวัน การหาระยะห่างของวันที่ต้องการสังเกตหรือสงสัย ปริมาณของข้อมูลในแต่ละวัน ตัวอย่างเช่น

-- Count requests created on February 29, 2016
SELECT count(*)
  FROM evanston311 
 WHERE date_created >= '2016-02-29' 
   AND date_created < '2016-03-01';

 แต่ก่อนที่จะไปการดูค่าทางสถิติ ก่อนอื่นไปจะต้องไปทำความเข้าใจในการจัดการข้อมูลวันที่และเวลาด้วย SQL กันก่อน

สิ่งที่จะต้องพิจารณาก่อน คือ เรื่องของ รูปแบบในการแสดงผลของ datetime จะมีอยู่ 3 กลุ่มใหญ่ ได้แก่
- DateYYYY-MM-DD เช่น 2023-07-21
- TimestampYYYY-MM-DD HH:MM:SS เช่น 2023-07-21 12:00:00
- Intervalลักษณะการแสดงผลเป็นช่วงเวลา เช่น 1 day 01:24:00

รวมถึง format ที่มีความหลากหลาย ไม่ว่าจะเป็น ISO, UTC เป็นเรื่องของ format ที่จะต้องรู้เพื่อกำหนดวันและเวลาที่ถูกต้อง รวมถึง timezone ต่างๆด้วย อย่างประเทศไทย timezone จะต้องเป็น GMT+7 เป็นต้น
แสดงความคิดเห็น
โปรดศึกษาและยอมรับนโยบายข้อมูลส่วนบุคคลก่อนเริ่มใช้งาน อ่านเพิ่มเติมได้ที่นี่