Chuyển đến nội dung chính

Basic R Series 1 - Mở dataset (Bộ số liệu) từ SPSS, EXCEL, STATA

  

Khi phân tích số liệu chúng ta luôn phải mở một bộ số liệu vào trước. Các bộ số liệu này có thể trước đó đã được nhập hay xử lý trên các phần mềm khác như EPIDATA, EXEL, STATA, SPSS,…

Lưu ý: Cần lấy địa chỉ của file data đó để sử dụng.Ví dụ C:/Users/caobakhuong/Downloads/shapiro.sav

1. Mở bộ số liệu từ SPSS (thường có đuôi là .sav)

Ở đây, chúng ta tiến hành mở bộ số liệu và đặt tên cho nó là data1

Qua package haven sẽ cho phép R mở một bộ số liệu từ nhiều nguồn khác nhau để xử lý.Đối với dữ liệu từ SPSS cũng vậy.

#Hãy cài package này bằng lệnh sau nếu chưa cài đặt
#install.packages('haven')
#Và load package này để sử dụng
library(haven)
#Load cái package để mở file từ SPSS
data1 <- read_sav("C:/Users/caobakhuong/Downloads/shapiro.sav")

Kết quả:

data1
## # A tibble: 1,976 × 5
##    MI        OC        SMOKE     AGEGROUP AGEMID    
##    <dbl+lbl> <dbl+lbl> <dbl+lbl>    <dbl> <dbl+lbl> 
##  1 0 [No]    0 [No]    0 [None]         1 27 [25-29]
##  2 0 [No]    0 [No]    0 [None]         5 47 [45-49]
##  3 0 [No]    0 [No]    0 [None]         3 37 [35-39]
##  4 0 [No]    0 [No]    0 [None]         2 32 [30-34]
##  5 0 [No]    1 [Yes]   0 [None]         4 42 [40-44]
##  6 0 [No]    0 [No]    0 [None]         3 37 [35-39]
##  7 0 [No]    0 [No]    0 [None]         1 27 [25-29]
##  8 0 [No]    0 [No]    0 [None]         2 32 [30-34]
##  9 1 [Yes]   0 [No]    0 [None]         5 47 [45-49]
## 10 0 [No]    0 [No]    0 [None]         2 32 [30-34]
## # … with 1,966 more rows

2. Mở bộ số liệu từ EXCEL

Ở đây, chúng ta tiến hành mở bộ số liệu và đặt tên cho nó là cd4 (liên quan đến HIV/AIDS)

#Ta cũng cần load cái package để sử dụng, nếu chưa có thì nhớ install.packages('readxl')
library(readxl)
cd4 <- read_excel("D:/basic stat training data/cd4.xlsx")

và xem kết quả:

cd4
## # A tibble: 2,376 × 8
##      time   cd4   age packs drugs   sex  cesd    id
##     <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1 -0.742   548  6.57     0     0     5     8 10002
##  2 -0.246   893  6.57     0     1     5     2 10002
##  3  0.244   657  6.57     0     1     5    -1 10002
##  4 -2.73    464  6.95     0     1     5     4 10005
##  5 -2.25    845  6.95     0     1     5    -4 10005
##  6 -0.222   752  6.95     0     1     5    -5 10005
##  7  0.222   459  6.95     0     1     5     2 10005
##  8  0.775   181  6.95     0     1     5    -3 10005
##  9  1.26    434  6.95     0     1     5    -7 10005
## 10 -1.24    846  2.64     0     1     5    18 10029
## # … with 2,366 more rows

3. Mở bộ số liệu từ STATA

Ở đây, chúng ta tiến hành mở bộ số liệu và đặt tên cho nó là cat

#Ta cũng cần load cái package để sử dụng, nếu chưa có thì nhớ install.packages('haven')
library(haven)
cat <- read_dta("D:/basic stat training data/cat.dta")

Kết quả:

cat
## # A tibble: 18 × 3
##       id catnumbe numberto
##    <dbl>    <dbl>    <dbl>
##  1   101       20        2
##  2   102       19        0
##  3   103       21        2
##  4   104        6        0
##  5   105        4        3
##  6   106        8        0
##  7   107       18        1
##  8   108       22        1
##  9   109       13        2
## 10   110       12        1
## 11   111       15        1
## 12   112       12        1
## 13   113        9        0
## 14   114       20        2
## 15   213       39        6
## 16   215       41        0
## 17   216       20        1
## 18   217       16        0

DONE!

Nhận xét

Bài đăng phổ biến từ blog này

EPIDATA 3.1- Phần mềm thống kê Y sinh học

Phần mềm thống kê Y sinh học EPIDATA 09:40 ,26/10/2010 Đối với các nhà khoa học trong lĩnh vực y sinh học, các phần mềm thống kê là công cụ đắc lực nhất giúp họ trong việc quản lý cơ sở sử liệu và phân tích đưa ra các kết quả mong muốn nhanh, chính xác và độ tin cậy cao. Tổ chức Y tế thế giới rất quan tâm đến lĩnh này và từ rất sớm đã hợp tác với cơ quan phòng chống bệnh Hoa kỳ    đưa ra phần mềm thống kê sinh học đơn giản, dễ sử dụng và có độ tin cậy cao với EPI-INFO từ thập kỷ 90 của thiên niên kỷ trước và được sử dụng miễn phí. Trải qua gần 20 năm Epi-info đã là một công cụ hửu ích cho tất cả những ai làm công tác trong lĩnh vực y học đặc biệt trong công tác y tế dự phòng, ngày nay với sự phát triển của công nghệ thông tin,    Epi-info tuy vẫn sử dụng tốt nhưng đã bộc lộ một số phiền toái cho người sử dụng đó là do phần mềm này thiết kế chạy trên nền hệ điều hành MSDOS nên hiện tại gặp nhiều khó khăn khi chạy trên nền Windows đặc biệ...

Phân tích bảng chéo Crosstabs trong SPSS

Crosstabs – Thực hành cách phân tích bảng chéo Crosstabs trong SPSS Phân tích này rất hữu ích trong việc xác định mối quan hệ, số lượng biến quan sát giữa các biến định tính, hoặc định lượng với nhau. CÁCH THỨC TIẾN HÀNH PHÂN TÍCH BẢNG CHÉO (CROSSTABULATION) Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau bằng cách dùng kiểm định Chi – bình phương (Chi-square). Cách thức tiến hành với SPSS như sau: Minh họa bằng hình ảnh Vào menu Analyze -> Descriptive Statistics -> Crosstabs…, Xuất hiện hộp thoại sau: Chọn và đưa các biến vào khung Row(s) (dòng) và Column(s) (cột) và Layer 1 of 1 (đối với trường hợp trên 2 biến). Click vào ô Statistics, xuất hiện hộp thoại sau: Chọn các kiểm định cần thiết. Trong trường hợp này ta dùng kiểm định Chi – bình phương (Chi-square). Các kiểm định ở ô Norminal dùng để kiểm định mối liên hệ giữa các biến biểu danh. Các kiểm định ở ô Ordinal dùng để kiểm định mối liên hệ giữa các biến thứ ...

Download SPSS MAC - Cài SPSS cho Macbook

Hôm nay tôi giới thiệu cho các bạn phần mềm SPSS miễn phí dành cho MACBOOK. Các bạn download về và tiến hành cài đặt nhé. bản này là bản SPSS 20 , cài rất dễ dàng tương tự cài trên windows. Cám bạn tải SPSS 20 MAC ở đây: https://drive.google.com/folderview?...00&usp=sharing - Máy của bạn cần phải có JAVA trước khi cài đặt, nếu không có thì chương trình sẽ tự download. - Bạn cần ngắt kết nối mạng trước khi chạy chương trình. - Chạy file cài đặt chương trình - Nhấn Next - Chọn Single user licence - Nhấn Install - Chọn License my product now - Dán vào mã 285DD4CD2854F4E67605, nhấn next - Chọn Desktop email - Nhấn vào nút Enter license code(s) - Dán mã vào ô License code 4B6MINO86Z4LZV9AA7GHEC89P5TRNTOHAA3XKX5YW7GM2SWHCC TAFYBL3B3IKPMM7I9N3MSTBXOO8VPKXZHSEXGST8 , sau đó nhấn Next - Nhấn Finish để hoàn thành việc cài đặt