Read "On Being a Scientist: Vietnamese Version" at NAP.edu (2024)

Below is the uncorrected machine-read text of this chapter, intended to provide our own search engines and external engines with highly rich, chapter-representative searchable text of each book. Because it is UNCORRECTED material, please consider the following text as a useful but insufficient proxy for the authoritative book pages.

The treatment of data - Xá»­ lý dữ liệu English version Bản dịch tiếng ViệtIn order to conduct research responsibly, graduate Để thá»±c hÃnh nghiên cứu có trách nhiệm, học viên sau đạistudents need to understand how to treat data học cần hiểu rõ cách xá»­ lý dữ liệu chính xác. Năm 2002, cáccorrectly. In 2002, the editors of the Journal of Cell biên tập viên của Tạp chí Sinh học Tế bÃo (Journal of CellBiology began to test the images in all accepted Biology) đã bắt đầu kiểm tra hình ảnh5 trong tất cả bản thảomanu- scripts to see if they had been altered in ways được chấp nhận đăng để xem liệu chúng có bị chỉnh sá»­a dẫnthat violated the journal’s guidelines. About a tới vi phạm các hướng dẫn của tạp chí6 hay không. Kết quảquarter of the papers had images that showed là có khoảng một phần tÆ° số bÃi báo có hình ảnh đã quaevidence of inappropriate manipulation. The editors chỉnh sá»­a không phù hợp so với các hướng dẫn nÃy. Các biênrequested the original data for these papers, tập viên đã yêu cầu dữ liệu gốc từ tác giả, so sánh dữ liệucompared the original data with the submitted gốc với các hình ảnh đã nộp, và yêu cầu các hình ảnh phảiimages, and required that figures be remade to được lÃm lại để tuân thủ với các hướng dẫn. Trong khoảngaccord with the guidelines. In about 1 percent of the 1% số bÃi báo, các biên tập viên đã tìm thấy bằng chứng củapapers, the editors found evidence for what they các "hÃnh vi gian lận" (fraudulent manipulation) gây ảnhtermed “fraudulent manipulation” that affected hưởng đến các kết luận được rút ra trong bÃi báo, dẫn đếnconclusions drawn in the paper, resulting in the việc bÃi báo bị từ chối đăng tải.papers’ rejection.Researchers who manipulate their data in ways that Việc các nhà nghiên cứu xá»­ lý dữ liệu của họ theo cách đánhdeceive others, even if the manipulation seems lừa người khác, ngay cả khi việc xá»­ lý đó dường nhÆ° khônginsignificant at the time, are violating both the basic ảnh hưởng đáng kể, nhÆ°ng cÅ©ng được xem là vi phạm cácvalues and widely accepted professional standards giá trị cÆ¡ bản và tiêu chuẩn chuyên môn vốn đã được chấpof science. Researchers draw conclusions based on nhận rộng rãi trong giới khoa học. Các nhà nghiên cứu đưatheir observations of nature. If data are altered to ra kết luận dá»±a trên những quan sát của họ về tá»± nhiên. Nếupresent a case that is stronger than the data thay đổi dữ liệu theo hướng kết luận mong muốn, họ sẽwarrant, researchers fail to fulfill all three of the không đáp ứng được cả ba nhóm nghÄ©a vụ được mô tả ởobligations described at the beginning of this guide. phần đầu của quyển sách nÃy. Họ đánh lừa đồng nghiệp củaThey mislead their colleagues and potentially mình và có thể gây cản trở sá»± tiến bộ trong nghiên cứu củaimpede progress in their field or research. They bản thân hoặc trong cả lÄ©nh vá»±c nghiên cứu. Họ lÃm suy giảmundermine their own authority and trustworthiness quyền hạn và sá»± đáng tin của người lÃm nghiên cứu. Khi đó,as researchers. And they introduce information into những thông tin sai lệch họ đưa vÃo tÃi liệu khoa học có thểthe scientific record that could cause harm to the gây ảnh hưởng xấu tới xã hội, ví dụ nhÆ° khi xem nhẹ nhữngbroader society, as when the dangers of a medical nguy cÆ¡ trong điều trị y tế.treatment are understated. 5 Xem thêm: https://ukrio.org/resources/research-integrity-resources/academic-image-integrity/ 6 Ví dụ: https://www.nature.com/nature-portfolio/editorial-policies/image-integrity 19

This is particularly important in an age in which the Điều nÃy đặc biệt quan trọng trong thời đại mà Internet choInternet al- lows for an almost uncontrollably fast phép lan truyền thông tin nhanh chóng và rộng rãi đến đôngand extensive spread of infor- mation to an đảo người xem một cách không kiểm soát. Do đó, dữ liệu saiincreasingly broad audience. Misleading or lệch hoặc không chính xác có thể gây ra những hậu quảinaccurate data can thus have far-reaching and nghiêm trọng và khó lường, ở mức độ chÆ°a từng thấy so vớiunpredictable consequences of a magnitude not trước khi có Internet và các công nghệ truyền thông hiện đạiknown before the Internet and other modern khác.communication technologies.Misleading data can arise from poor experimental Dữ liệu sai lệch có thể phát sinh từ thiết kế thí nghiệm khôngdesign or care- less measurements as well as from hợp lý, các phép đo bất cẩn hoặc do thao tác chÆ°a đúng.improper manipulation. Over time, researchers Theo thời gian, các nhà nghiên cứu đã phát triển và liên tụchave developed and have continually improved cải tiến các phÆ°Æ¡ng pháp và công cụ để giữ sá»± liêm chínhmethods and tools designed to maintain the trong nghiên cứu. Một số phÆ°Æ¡ng pháp và công cụ được sá»­integrity of research. Some of these methods and dụng trong các lÄ©nh vá»±c nghiên cứu cụ thể, chẳng hạn nhÆ°tools are used within specific fields of research, such kiểm tra sá»± khác biệt có ý nghÄ©a thống kê, thá»­ nghiệm “mùas statistical tests of significance, double-blind trials, đôi”7 và diễn giải chính xác một câu hỏi hay vấn đề trong cácand proper phrasing of questions on surveys. Others khảo sát. NgoÃi ra, còn có các phÆ°Æ¡ng pháp và công cụ đượcapply across all research fields, such as describing to áp dụng trên tất cả các lÄ©nh vá»±c nghiên cứu, chẳng hạn nhÆ°others what one has done so that research data and mô tả lại cho người khác những gì được thá»±c hiện, qua đóresults can be verified and extended. dữ liệu và kết quả nghiên cứu có thể được xác minh và mở rộng.Because of the critical importance of methods, PhÆ°Æ¡ng pháp thí nghiệm đóng vai trò rất quan trọng, do đóscientific papers must include a description of the các bÃi báo khoa học cần phải mô tả chi tiết quy trình đã sá»­procedures used to produce the data, sufficient to dụng để tạo ra dữ liệu, điều nÃy cho phép người phản biệnpermit reviewers and readers of a scientific paper to và người đọc đánh giá không chỉ tính hợp lệ của dữ liệu mÃevaluate not only the validity of the data but also còn cả độ tin cậy của các phÆ°Æ¡ng pháp được sá»­ dụng để thuthe reliability of the methods used to derive those thập những dữ liệu đó. Nếu thông tin nÃy không được cungdata. If this information is not available, other cấp đầy đủ, các nhà nghiên cứu khác khó có thể chấp nhậnresearchers may be less likely to accept the data and các dữ liệu và kết luận rút ra từ chúng. Họ cÅ©ng không thểthe conclusions drawn from them. They also may be lặp lại (reproduce8) chính xác các điều kiện mà dữ liệu đượcunable to reproduce accurately the conditions thu thập.under which the data were derived. 7 Thá»­ nghiệm “mù đôi” (Double-Blind Study): Theo Từ điển của Trung tâm Ung thÆ° Quốc gia (Mỹ), thá»­ nghiệm “mù đôi” thường được sá»­ dụng trong nghiên cứu lâm sÃng, mà cả người tham gia và nhà nghiên cứu đều không biết những người tham gia thá»­ nghiệm thuộc nhóm đối chứng hay nhóm thá»­ thuốc/trị liệu, cho đến khi thá»­ nghiệm kết thúc. Điều nÃy giúp cho kết quả của nghiên cứu ít có khả năng bị sai lệch bởi các yếu tố không liên quan đến việc điều trị. 8 Trong đa số lÄ©nh vá»±c, reproduce chỉ hÃnh động lặp lại thí nghiệm của những người thá»±c hiện khác nhau, tại các phòng thí nghiệm khác nhau, với nguồn mẫu giống/dữ liệu đầu vÃo giống với thí nghiệm gốc. Xem thêm tại: https://www.ncbi.nlm.nih.gov/books/NBK547546/ 20

The best methods will count for little if data are Dù sá»­ dụng những phÆ°Æ¡ng pháp tốt nhất, nhÆ°ng nếu dữ liệurecorded incorrectly or haphazardly. The được ghi lại không chính xác hay không theo trật tá»± thì cácrequirements for data collection differ among phÆ°Æ¡ng pháp đó cÅ©ng không mang lại nhiều giá trị. Các yêudisciplines and research groups, but researchers đầu đối với việc thu thập dữ liệu có thể khác nhau giữa cáchave a fundamental obligation to create and lÄ©nh vá»±c và nhóm nghiên cứu, nhÆ°ng các nhà nghiên cứu cómaintain an accurate, accessible, and permanent nghÄ©a vụ cÆ¡ bản là tạo ra và duy trì việc ghi chép (record)record of what they have done in sufficient detail for chính xác, lÆ°u giữ thông tin lâu dÃi và những người khác cóothers to check and replicate their work. Depending thể truy cập để kiểm tra và lặp lại (replicate9) công việc củaon the field, this obligation may require entering họ khi cần. Tùy thuộc vÃo lÄ©nh vá»±c, giao ước nÃy có thể códata into bound notebooks with sequentially những yêu cầu cụ thể hÆ¡n, chẳng hạn nhÆ° yêu cầu ghi nhậnnumbered pages using permanent ink, using a dữ liệu bằng má»±c vÄ©nh viễn (không thể tẩy xóa) vÃo sổ đóngcomputer application with secure data entry fields, gáy có đánh số trang, sá»­ dụng phần mềm máy tính với cácidentifying when and where work was done, and trường nhập dữ liệu an toÃn. Các bản ghi chép còn cần xácretaining data for specified lengths of time. In much định thời gian, địa điểm thá»±c hiện thí nghiệm và lÆ°u giữ cácindustrial research and in some academic research, các dữ liệu nÃy trong khoảng thời gian cụ thể. Trong nhiềudata notebooks need to be signed and dated by a nghiên cứu ở quy mô công nghiệp và trong một số nghiênwitness on a daily basis. cứu học thuật, sổ ghi chép dữ liệu cần được nhân chứng ký tên và xác nhận thời gian thá»±c hiện hÃng ngÃy.Unfortunately, beginning researchers often receive Thật không may, các nhà nghiên cứu mới thường ít hoặcl*ttle or no formal training in recording, analyzing, không được đÃo tạo bÃi bản về cách ghi chép, phân tích, lÆ°ustoring, or sharing data. Regularly scheduled trữ hoặc chia sẻ dữ liệu. Do đó, các nhóm và các đơn vịmeetings to discuss data issues and policies nghiên cứu cần tổ chức và duy trì một cách thường xuyênmaintained by research groups and institutions can các cuộc họp để thảo luận về các vấn đề và quy chế liên quanestablish clear expectations and responsibilities. đến dữ liệu, nhằm xác định rõ rÃng các kỳ vọng và trách nhiệm khi lÃm nghiên cứu.The Selection of Data Chọn lá»±a dữ liệuDeborah, a third-year graduate student, and Deborah - nghiên cứu sinh năm thứ ba và Kamala - nghiênKamala, a postdoc- toral fellow, have made a series cứu sinh sau tiến sÄ© đã thá»±c hiện một loạt các phép đo trênof measurements on a new experimental một vật liệu bán dẫn mới bằng cách sá»­ dụng thá»­ nghiệmsemiconductor material using an expensive neutron neutron đắt tiền tại phòng thí nghiệm quốc gia. Khi họ trở lạitest at a national laboratory. When they return to phòng thí nghiệm riêng của nhóm nghiên cứu và kiểm tra dữtheir own laboratory and examine the data, a newly liệu, một giả thuyết mới dá»±a trên mô hình toán học đã được 9 Trong đa số lÄ©nh vá»±c, replicate chỉ hÃnh động lặp lại thí nghiệm nghiệm của những người thá»±c hiện khác nhau, có thể thá»±c hiện tại cùng hoặc khác phòng thí nghiệm gốc, với nguồn mẫu/dữ liệu đầu vÃo khác với thí nghiệm gốc. Xem thêm tại: https://www.ncbi.nlm.nih.gov/books/NBK547546/ 21

proposed mathematical explanation of the đề xuất nhằm dá»± đoán thuộc tính của vật liệu bán dẫn. Kếtsemiconductor’s behavior predicts results indicated quả dá»± đoán từ mô hình nÃy là một đường cong.by a curve.During the measurements at the national Trong suốt quá trình thá»±c nghiệm tại phòng thí nghiệm quốclaboratory, Deborah and Kamala observed electrical gia, Deborah và Kamala đã quan sát thấy các biến động vềpower fluctuations that they could not control or điện năng mà họ không thể kiểm soát hoặc dá»± đoán được vÃpredict were affecting their detector. They suspect lÃm ảnh hưởng đến bộ phận đọc tín hiệu (detector). Họ nghithe fluctuations affected some of their ngờ những biến động đó đã ảnh hưởng đến kết quả của mộtmeasurements, but they don’t know which ones. số phép đo, nhÆ°ng họ không biết chính xác nguyên nhân. KhiWhen Deborah and Kamala begin to write up their Deborah và Kamala bắt đầu viết kết quả của họ để trình bÃyresults to present at a lab meeting, which they know tại cuộc họp của phòng thí nghiệm, bước đầu tiên trong quáwill be the first step in preparing a publication, trình chuẩn bị công bố. Kamala đề nghị bỏ hai điểm dữ liệuKamala suggests dropping two anomalous data bất thường gần trục hoÃnh ra khỏi biểu đồ. Dá»±a vÃo độ lệchpoints near the horizontal axis from the graph they giá trị của hai điểm nÃy so với đường cong dá»± đoán, cô ấyare preparing. She says that due to their deviation cho rằng các giá trị bất thường nÃy là do dao động điện năngfrom the theoretical curve, the low data points were trong quá trình thí nghiệm gây ra. HÆ¡n nữa, độ lệch nÃy cònobviously caused by the power fluctuations. nằm ngoÃi giá trị sai số mong đợi được tính dá»±a trên cácFurthermore, the deviations were outside the điểm dữ liệu còn lại.expected error bars calculated for the remainingdata points.Deborah is concerned that dropping the two points Deborah lo ngại rằng việc loại bỏ hai điểm dữ liệu có thể bịcould be seen as manipulating the data. She and coi là chỉnh sá»­a dữ liệu. Cô và Kamala không thể chắc chắnKamala could not be sure that any of their data điểm dữ liệu nÃo (nếu có) chịu ảnh hưởng bởi sá»± dao độngpoints, if any, were affected by the power điện năng. Họ cÅ©ng không biết liệu dá»± đoán dá»±a trên lýfluctuations. They also did not know if the thuyết có hợp lệ không. Cô ấy muốn thá»±c hiện một phân tíchtheoretical prediction was valid. She wants to do a riêng bao gồm tất cả các điểm dữ liệu và thảo luận vấn đềseparate analysis that includes the points and nÃy trong buổi họp. NhÆ°ng Kamala nói rằng nếu họ đưa cácdiscuss the issue in the lab meeting. But Kamala says điểm dữ liệu vÃo nội dung trình bÃy, những người khác sẽthat if they include the data points in their talk, nghÄ© đây là vấn đề quan trọng và cần phải thảo luận trongothers will think the issue important enough to nội dung bản thảo, điều nÃy sẽ khiến bÃi báo khó được côngdiscuss in a draft ‘paper, which will make it harder bố hÆ¡n. Thay vÃo đó, lúc nÃy cô ấy và Deborah nên sá»­ dụngto get the paper published. Instead, she and khả năng phán đoán chuyên môn của mình để loại bỏ 2 điểmDeborah should use their professional judgment to dữ liệu đó.drop the points now. 1. Những yếu tố nÃo Kamala và Deborah nên xem xét1. What factors should Kamala and Deborah take trước khi quyết định cách trình bÃy dữ liệu từ thí nghiệminto account in deciding how to present the data của họ?from their experiment? 22

2. Should the new explanation predicting the results 2. Liệu cách giải thích mà họ đưa ra để dá»± đoán kết quảaffect their deliberations? có ảnh hưởng đến quá trình suy xét của họ không?3. Should a draft paper be prepared at this point? 3. Có nên chuẩn bị bản thảo của bÃi báo vÃo thời điểm nÃy4. If Deborah and Kamala can’t agree on how the không?data should be presented, should one of them 4. Nếu Deborah và Kamala không thể thống nhất về cáchconsider not being an author of the paper? trình bÃy dữ liệu, liệu một trong số họ có nên cân nhắc việc không trở thÃnh tác giả của bÃi báo không? 23

Read "On Being a Scientist: Vietnamese Version" at NAP.edu (2024)
Top Articles
Latest Posts
Article information

Author: Ray Christiansen

Last Updated:

Views: 6478

Rating: 4.9 / 5 (49 voted)

Reviews: 88% of readers found this page helpful

Author information

Name: Ray Christiansen

Birthday: 1998-05-04

Address: Apt. 814 34339 Sauer Islands, Hirtheville, GA 02446-8771

Phone: +337636892828

Job: Lead Hospitality Designer

Hobby: Urban exploration, Tai chi, Lockpicking, Fashion, Gunsmithing, Pottery, Geocaching

Introduction: My name is Ray Christiansen, I am a fair, good, cute, gentle, vast, glamorous, excited person who loves writing and wants to share my knowledge and understanding with you.