<div>Hi Kyle,</div>
<div> </div>
<div>Other colleagues and friends have provided a rich set of answers to your question. But my response may seem at least at first glance a bit naive and my questions would be kind of silly questions! Perhaps these silly questions may deserve to allocate sometime to think about!</div>

<div> </div>
<div>Frankly speaking I am personally confused by the question you posed in your initiating e-mail?!</div>
<div> </div>
<div>As I could understand, you are intending to ask your students to include in their CVs the results of the field station works that they'd fulfilled. This means two different notions for me: The first notion is that the students are going to archiving the results of their works in the form of an either published or unpublished (lets say Formal or Informal) papers OR my second take is that the students will include (insert fully or partially [e.g. only Metadata]) of their results in their CVs! These imply and speculate two different notions and we may expect different outputs from each process accordingly. If the above are two processes that your are following in your intended CV citation job, then one may argue that it is not surprisingly new thing to do and that both has been practiced already by many scientific and even business communities for data archival and sharing. </div>

<div> </div>
<div>The second confusing issue is that whether your students are going to put their datasets in their CVs so that these sets of data could be accessed and/or cited by other members of the scientific community who are reaching out to the archived datasets in the CVs? or in another say, are the students, by inclusion of their datasets in their CVs, requesting implicitly other peer researchers to cite their dataset sources in their articles?! and HOW?</div>

<div> </div>
<div>I have got confused by the above issues as it is not clearly indicated in your question that "what exactly is the problem" with this type of datatset archiving? As dataset archiving and referencing have been an accepted process by majority of research communities and have been in use for at least a decade or so. Though I could not figure out a unified and universally accepted guideline, standard and/or white paper as the rulling entity of this puzzle! Each emerging dataset archival and sharing community, in contrast seems to has adopted its own dataset and information archiving and storage guideline! And this is the unfortunate situation that the new database management community try to resolve yet one may consider that the process has already begon and is in rapid progress.  </div>

<div> </div>
<div>In my understanding, all the recent advances and practices, which have been pursued through the past at least half a decade were towards building a foundational frameworks using standard protocols and Grid-base technology to create a context for better archival, sharing, retrieval, access and use of scattered datasets by different reaserch groups and to improve the interoperability of these kind of data archival, sharing and usage. The LTER, Ecoinformatics, NCEAS, ACEAS, SWEET ontology, Biopax and similar projects were pursuing the similar idea of making the implicit knowledge and poorly designed and shared data and information a more tractible, explicit, formally shaped and accessible for diversitty of uses through an ineroperable system of data and knowledge sharing. </div>

<div> </div>
<div>I have already collected a set of URLs for this diversity of communities who have been and are practicing to have all distributed data and metadata together in order to make them at least easily accessible and usable for the global research and scientific community. </div>

<div> </div>
<div>Examples are:</div>
<div><a href="http://www.ecoinformatics.org/">http://www.ecoinformatics.org/</a></div>
<div><a href="http://www.nceas.ucsb.edu/">http://www.nceas.ucsb.edu/</a></div>
<div><a href="http://www.opencyc.org/">http://www.opencyc.org/</a></div>
<div><a href="http://www.geongrid.org/">http://www.geongrid.org/</a></div>
<div><a href="http://ontology.buffalo.edu/">http://ontology.buffalo.edu/</a></div>
<div><a href="http://www-ksl.stanford.edu/sns.shtml">http://www-ksl.stanford.edu/sns.shtml</a><br><a href="http://www.ontoknowledge.org/oil/">http://www.ontoknowledge.org/oil/</a><br><a href="http://www.ontologyportal.org/">http://www.ontologyportal.org/</a></div>

<div><a href="http://www.environmentontology.org/">http://www.environmentontology.org/</a></div>
<div><a href="http://www.ifomis.org/bfo">http://www.ifomis.org/bfo</a></div>
<div><a href="http://www.onto-med.de/ontologies/gfo/">http://www.onto-med.de/ontologies/gfo/</a></div>
<div><a href="http://www.openclinical.org/ontologies.html">http://www.openclinical.org/ontologies.html</a></div>
<div><a href="http://www.geneontology.org/">http://www.geneontology.org/</a></div>
<div><a href="http://www.obofoundry.org/">http://www.obofoundry.org/</a></div>
<div><a href="http://www.plantontology.org/">http://www.plantontology.org/</a></div>
<div><a href="http://sweet.jpl.nasa.gov/">http://sweet.jpl.nasa.gov/</a><br></div>
<div>And many others that are growing up rapidly.</div>
<div> </div>
<div>Therfore, istead of asking that if the dataset archival process has been or is currently a NORM?!, we would better argue that "HOW TO DO THE JOB PROPERLY?" It means that the job is already started but lacking a unified protocol. This in turn means that what type of standards or guidelines or protocols shall be followed to make all dataset archiving and retreival process harmonized and explicitly understandable and reusable by users from different corners of the world (i.e. plugged to the grid)?!</div>

<div> </div>
<div>The recent advances in XML and semantic web technology have made it much more easier and user friendly for professionals from different scientific and empirical domains to apply the concepts and tools that have made available for the target community. </div>

<div> </div>
<div>And as such, the issue that remains to be addressed and discussed in order to get a deeper understanding of the consequences of these types of dataset archival may rather be (in my view) to generate and have an overall consencus on a set of guiding ruls and protocols that facilitates and harmonizes the process and outcomes of any attempt for data archival, retrieval, processing, sharing and improved interoperabilty. </div>

<div> </div>
<div>I tried to collect a number of articles from the net (all were openly accessable!) that I am attaching hereto for your attention and probable use. I do hope that what I tried to explain in the above lines would be of help.</div>

<div> </div>
<div>Good luck,</div>
<div>Reza Chalabianlou</div>
<div> </div>
<div>   </div>
<div> </div>
<div><br><br> </div>
<div class="gmail_quote">On Thu, Jul 14, 2011 at 11:49 PM, Carl Boettiger <span dir="ltr"><<a href="mailto:cboettig@gmail.com">cboettig@gmail.com</a>></span> wrote:<br>
<blockquote style="BORDER-LEFT: #ccc 1px solid; MARGIN: 0px 0px 0px 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">Kyle, 
<div><br></div>
<div>Thanks for the reply.  I would be interested to know what option you settle on to get a persistent identifier when you get a chance.  I'm sure others on the list could offer some input on the strengths and weaknesses of some common ones as well.  </div>

<div><br></div>
<div>Cheers,</div>
<div>Carl 
<div>
<div></div>
<div class="h5"><br><br>
<div class="gmail_quote">On Thu, Jul 14, 2011 at 12:15 PM, Kyle Kwaiser <span dir="ltr"><<a href="mailto:kkwaiser@umich.edu" target="_blank">kkwaiser@umich.edu</a>></span> wrote:<br>
<blockquote style="BORDER-LEFT: #ccc 1px solid; MARGIN: 0px 0px 0px 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">Hi Carl,<br><br>The repository we use is one I have built on Drupal for our field station:<br><br><a href="http://umbs.lsa.umich.edu/" target="_blank">http://umbs.lsa.umich.edu/</a><br>
<br>Thanks to work done by the LTER, I am able to provide metadata in an EML compliant format and, at some point in the future, I will leverage this to facilitate data contribution to a third party.  I am aware of several such options but have not begun the process of evaluating them.<br>
<br>This means that I cannot offer a formal persistent identifier which is hardly ideal and one of the reasons I hesitate to tell students to place citations on their CV's.<br><br>Best,<br><font color="#888888"><br>Kyle</font> 
<div>
<div></div>
<div><br><br><br><br>Quoting Carl Boettiger <<a href="mailto:cboettig@gmail.com" target="_blank">cboettig@gmail.com</a>>:<br><br>
<blockquote style="BORDER-LEFT: #ccc 1px solid; MARGIN: 0px 0px 0px 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">Kyle,<br><br>Are your students archiving these in repositories that will issue a doi for<br>the citation information?  (Merritt, Dryad if they correspond to already<br>
published work, etc)?<br><br><br>Here's a few more refs that have argued for this, some quite extensively.<br><br>This whole piece is essentially an argument for data citation:<br>?Mons, B., Haagen, H. van, Chichester, C., Hoen, P.-B. ?T, Dunnen, J. T.<br>
den, Ommen, G. van, et al. (2011). The value of data. Nature genetics,<br>43(4), 281-3. Nature Publishing Group. doi: 10.1038/ng0411-281.<br><br><br>Birney, E., Hudson, T. J., Green, E. D., Gunter, C., Eddy, S., Rogers, J.,<br>
et al. (2009). Prepublication data sharing. Nature, 461(7261), 168-70. doi:<br>10.1038/461168a.<br>"another would be to track the usage and citation of data sets using<br>electronic systems similar to those used for traditional publications"<br>
..<br>who cite this in support:<br>Sharing Data from Large-scale Biological Research Projects: A System of<br>Tripartite Responsibility (Wellcome Trust, 2003); available at<br><a href="http://www.wellcome.ac.uk/stellent/groups/corporatesite/@policy_communications/documents/" target="_blank">www.wellcome.ac.uk/stellent/<u></u>groups/corporatesite/@policy_<u></u>communications/documents/</a><br>
web_document/wtd003207.pdf<br><br><br>Tenopir, C., Allard, S., Douglass, K., Aydinoglu, A. U., Wu, L., Read, E.,<br>et al. (2011). Data Sharing by Scientists: Practices and Perceptions. (C.<br>Neylon, Ed.)PLoS ONE, 6(6), e21101. doi: 10.1371/journal.pone.0021101.<br>
    "Providing a secure but flexible cyberinfrastructure while promulgating<br>best practices such as data citation and metadata reuse, will help build<br>confidence in data sharing"<br><br><br>Rod discusses data  citation quite a bit here:<br>
?Page, R. D. M. (2010). Enhanced display of scientific articles using<br>extended metadata. Web Semantics: Science, Services and Agents on the World<br>Wide Web, 8(2-3), 190-195. doi: 10.1016/j.websem.2010.03.004.<br><br>
<br>?Constable, H., Guralnick, R., Wieczorek, J., Spencer, C., & Peterson, a T.<br>(2010). VertNet: a new model for biodiversity data sharing. PLoS biology,<br>8(2), e1000309. doi: 10.1371/journal.pbio.1000309.<br>"By ensuring that data remain curated at the source, and by showing the<br>
importance of data sharing to promote data citation and usage, we have grown<br>past our original technology implementation and are ready to move into a<br>long-term production environment that departs from the original model."<br>
<br><br>These three make mention of data citation, mostly in reference to increased<br>citation rates of papers.<br>?Moore, A. J., McPeek, M. a, Rausher, M. D., Rieseberg, L., & Whitlock, M.<br>C. (2010). The need for archiving data in evolutionary biology. Journal of<br>
evolutionary biology, 23(4), 659-60. doi: 10.1111/j.1420-9101.2010.<u></u>01937.x.<br><br>Whitlock, M. C., McPeek, M. a, Rausher, M. D., Rieseberg, L., & Moore, A. J..<br>(2010). Data archiving. The American naturalist, 175(2), 145-6. doi:<br>
10.1086/650340.<br><br>Whitlock, M. C. (2010). Data archiving in ecology and evolution: best<br>practices. Trends in Ecology & Evolution, 1-5. Elsevier Ltd. doi:<br>10.1016/j.tree.2010.11.006.<br><br>Mark Parson's talk: <a href="http://ands.org.au/guides/data-citation-awareness.html" target="_blank">http://ands.org.au/guides/<u></u>data-citation-awareness.html</a><br>
<br>-Carl<br><br><br><br><br>On Thu, Jul 14, 2011 at 8:22 AM, Cook, Robert B. <<a href="mailto:cookrb@ornl.gov" target="_blank">cookrb@ornl.gov</a>> wrote:<br><br>
<blockquote style="BORDER-LEFT: #ccc 1px solid; MARGIN: 0px 0px 0px 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">Kyle,<br><br>At the ORNL DAAC we have been providing recommended citations for our<br>published data sets since the early 2000s.  These citations are appearing in<br>
papers that use the data publication.  Citing data products gives the<br>authors credit for the intellectual effort in generating the data set.<br><br>Please refer to the attached note for additional information.<br><br>When we publish these data products, I send a note to each author<br>
congratulating them on their publication and encouraging them to place the<br>citation data pub on their cv.<br><br>Many journals will allow data product citations to appear in the references<br>section of papers.<br><br>
We are working with the Web of Knowledge to place these data pubs into<br>their indexing service, so that authors can view both their publications and<br>their data products.  Plus they can readily see who has used their data in<br>
subsequent publications.<br><br>Good luck!<br>Bob<br><br><br>-----Original Message-----<br>From: <a href="mailto:ecoinfo-bounces@ecoinformatics.org" target="_blank">ecoinfo-bounces@<u></u>ecoinformatics.org</a> [mailto:<br>
<a href="mailto:ecoinfo-bounces@ecoinformatics.org" target="_blank">ecoinfo-bounces@<u></u>ecoinformatics.org</a>] On Behalf Of Kyle Kwaiser<br>Sent: Thursday, July 14, 2011 10:16 AM<br>To: <a href="mailto:ecoinfo@ecoinformatics.org" target="_blank">ecoinfo@ecoinformatics.org</a><br>
Subject: [ecoinfo] Citation norms for datasets<br><br>Hello Colleagues,<br><br>I am working with graduate students this summer to archive their work<br>at our field station.  I want to tell them to cite their datasets on<br>
their CV's but I know this is not yet the norm.<br><br>Any general thoughts on how close we are to including datasets on<br>CV's?  Can you suggest recent papers that argue (decisively) for this<br>practice?  Here are two relevant but slightly tangential examples:<br>
<br>Reichman, O. J., M. B. Jones, and M. P. Schildhauer. 2011. "Challenges<br>and Opportunities of Open Data in Ecology." Science 331 (6018)<br>(February): 703-705. doi:10.1126/science.1197962.<br><br>Vision, Todd J. 2010. "Open Data and the Social Contract of Scientific<br>
Publishing." BioScience 60 (5) (May): 330-331.<br>doi:10.1525/bio.2010.60.5.2.<br><br>Best,<br><br>Kyle<br><br><br>------------------------------<u></u>-----------<br>Kyle Kwaiser, Information Manager<br>University of Michigan Biological Station<br>
9133 Biological Rd.<br>Pellston, Michigan 49769-9149 USA<br>Ph: <a href="tel:231-539-8789" target="_blank" value="+12315398789">231-539-8789</a><br>______________________________<u></u>_________________<br>Ecoinfo mailing list<br>
<a href="mailto:Ecoinfo@ecoinformatics.org" target="_blank">Ecoinfo@ecoinformatics.org</a><br>hxxp://<a href="http://lists.nceas.ucsb.edu/ecoinformatics/mailman/listinfo/ecoinfo" target="_blank">lists.nceas.ucsb.edu/<u></u>ecoinformatics/mailman/<u></u>listinfo/ecoinfo</a><br>
<br><br>______________________________<u></u>_________________<br>Ecoinfo mailing list<br><a href="mailto:Ecoinfo@ecoinformatics.org" target="_blank">Ecoinfo@ecoinformatics.org</a><br><a href="http://lists.nceas.ucsb.edu/ecoinformatics/mailman/listinfo/ecoinfo" target="_blank">http://lists.nceas.ucsb.edu/<u></u>ecoinformatics/mailman/<u></u>listinfo/ecoinfo</a><br>
<br><br></blockquote><br><br>--<br>Carl Boettiger<br>UC Davis<br><a href="http://www.carlboettiger.info/" target="_blank">http://www.carlboettiger.info/</a><br><br></blockquote><br><br><br>------------------------------<u></u>-----------<br>
Kyle Kwaiser, Information Manager<br>University of Michigan Biological Station<br>9133 Biological Rd.<br>Pellston, Michigan 49769-9149 USA<br>Ph: <a href="tel:231-539-8789" target="_blank" value="+12315398789">231-539-8789</a><br>
</div></div></blockquote></div><br><br clear="all"><br></div></div>-- <br>
<div class="im">Carl Boettiger<br>UC Davis<br><a href="http://www.carlboettiger.info/" target="_blank">http://www.carlboettiger.info/</a><br><br></div></div><br>_______________________________________________<br>Ecoinfo mailing list<br>
<a href="mailto:Ecoinfo@ecoinformatics.org">Ecoinfo@ecoinformatics.org</a><br><a href="http://lists.nceas.ucsb.edu/ecoinformatics/mailman/listinfo/ecoinfo" target="_blank">http://lists.nceas.ucsb.edu/ecoinformatics/mailman/listinfo/ecoinfo</a><br>
<br></blockquote></div><br><br clear="all"><br>-- <br>To preserve the Earth's life supporting functions, please don't print this e-mail and it's attachments unless you really need to. Thank you. <br>