Últimas Actualizaciones del Evento

Bibliometric indicators as part of the research ecosystem

Posted on Actualizado enn

Can we see the bibliometric indicators as part of an  ecosystem? I think so…

Let me explain. I’m involved in a project related to bibliometric analytics, seeing the first results, I realise, as I read many and many times, that the bibliometric indicators are a good quantitative indicators to measure the research results, but should not be the only or the main measures to evaluate a researcher.

The bibliometric indicators such as citations counts or downloads, have different biases depending on age, discipline and co-authorship. As it is good explained in this paper.

The number of citations increased with the age (number of years of active researcher) of the individual, so the square root of number of citations divided by the age is almost a constant.

Different disciplines have different citation cultures, so citation counts cannot be directly compared.

Must take the degree of co-authorship into account.

Finally we must take also into account that indicators such as provided by WOS, Scopus and Google Scholar (the most relevant), do not cover all areas of research, being Google Scholar the widest.

We can see the researcher environment as an ecosystem that depends on the researchers personal profile, their collaboration relationships, their research scope, their media activity (measured thru altmetrics), other indicators such eigenfactor among others. Only seeing the researchers as a whole, interacting in an environment, we can evaluate them, and not only thru two or three indicators.

In short, we can show the main bibliometric indicators, as we can see bellow, but it’s not a result or an evaluation as well, it’s only information that we need to analyse in order to evaluate the results.

see UVICs PPC

uvic1uvic2

 

 

euroCRIS membership meeting in Dublin talking about #OpenScience

Posted on Actualizado enn

As a member of euroCRIS organisation, I attended the Spring 2017 EuroCRIS Membership Meeting in Dublin taking place from the 29th and until de 31st of May. During the meeting I presented one of our leading projects in scientific management; the implementation of a SIGMA CRIS CERIF for Universitat Pompeu Fabra (UPF).

sigma-lidera-la-implementacion-de-cerif-en-eurocris_4745062DBJjtr-WAAAVn0q

My presentation was the story of how a CRIS system implementation was able to boost scientific information both internally and externally for an institution leading in research. There, I presented through some real examples, how to use and reuse the scientific information with a goal:

“collect data once, reuse it many times”

I talked about the data quality, avoiding redundancy, the using of standards and the relationship with openAccess among others.

Later, I presented the 100% cloud SIGMA Research tools that gives support to the whole research lifecycle.

I have also the opportunity to attend all the presentations, were participants, showed various examples of CRISs in different European countries, focusing on the openScience (mainly openAccess, openData), and how to improve the use of the scientific information, highlighting the role of the libraries.

We also took the chance to establish the general tends of the state-of-the-art of the CRIS implementations as well as future needs. We are agree of the importance of CRIS for the future of research recognising there is still a lot to be done.

In terms of the future needs, we all emphasised the fact that researchers should improve their data management skills in order to make the information more useful and shareable. Another area to improve is the visibility of CRIS amongst institutions to prevent parallel and unilateral projects to resolve what CRIS already resolves. Finally, constant communication to guarantee the information is updated in the institutional repositories and accountability of the information were also highlighted as important milestones to move forward.

In short, very interesting presentations, in the beautiful city of Dublin!

 

 

Nueva edición de la #redUGI red de unidades de gestión de la investigación de #universidades españolas

Posted on Actualizado enn

El pasado 25 y 26 de mayo fui invitada como ponente al encuentro de la redUGI en la Universidad de Valladolid, para presentar los productos de gestión de la investigación de SIGMA Research.

La Red de Unidades de Gestión de la Investigación (Red UGI) agrupa a la practica totalidad de las Universidades españolas. Se constituyó en 2006, en el seno de la CRUE, con los objetivos de potenciación de la profesionalización de las unidades de gestión de la investigación, la promoción e implantación de sistemas de calidad, la promoción de una oferta permanente de formación, el intercambio de buenas prácticas de gestión y la colaboración con los distintos órganos financiadores.

Así mismo, tuve la oportunidad de asistir a las diferentes ponencias que se realizaron en el transcurso del encuentro, que me parecieron muy interesantes.

Uno de los temas interesantes que se debatieron, fueron el necesario acercamiento entre los ámbitos de Gestión del Doctorado y la Gestión de la Investigación, así como temas de administración electrónica.

También se destacó el importante rol que juegan estas unidades de gestión dentro del ámbito de la investigación.

En general, unas jornadas muy interesantes y un placer poder participar en ellas.

DAvorCsWsAAS_lj

Bibliometric indicators. Key information for the Researcher #bibliometrics #research #CRIS

Posted on Actualizado enn

logo

I’ve been involved in a very interesting Project with some of the universities of the SIGMA AIE universities consortium where I work. It’s not new, and maybe it seems that it’s not a big project, but the relevance of the results that it shows, are clear.

It’s about the researchers Bibliometric information. As we know, this is a very important and relevant information for the Researchers and their scientific activity. It’s a key information, for example, to obtain funding and for their accreditation and evaluation as a researcher or scholar.

This information is extracted automatically and stored in the CRIS (Current Research Information System of the institution), so nobody must enter it. This information is sometimes validated by the library staff.

logo_principal_boxeologoccuvic_color

 

Here are two exemples:

You can access the ‘Scientific Production Portal’ of the Universitat de Vic-Central de Catalunya, UVIC-UCC or the ‘Scientific output’ of the Universitat Pompeu Fabra, UPF publically, and select a Researcher of the institution. Here, we can see their main bibliometric indicators such as: Index H of WOS, Scopus and Google scholar and cites of google scholar besides the Researcher photo.

ppc1

Then, we can enter one of the publications and see the main bibliometric indicators related to the publication such as: cites in Scopus, Wos, Google scholar, Scimago, altmetrics and so on…

ppc2

Another example, this time from the UPF:

ppc3

 

This information, in addition to giving public information about the Researcher, is very valuable information for the institution that can manage information about its positioning and can analyze its scientific production thru these standard indicators. The possibilities are great.

I really enjoyed being in this project, and it’s only the beginning…

 

El problema de compartir datos #openData #DataShare

Posted on Actualizado enn

share-300x225

Se habla mucho de compartir los datos de la investigación y de sus múltiples ventajas. Es cierto, pero está claro que es un tema que tiene una complejidad que a veces no solemos ver y que, como no, siempre se la encuentra el investigador.

Intentaré analizar un poco la situación.

Es cierto que es necesario compartir datos porque cada vez hay más proyectos pluridisciplinares que lo requieren y fomenta la colaboración. Si ven tus datos, te pueden buscar, también podría verse como una forma de divulgación y de visibilidad del investigador.

También está claro que se tiende cada vez más a la eliminación del concepto de publicación definitiva. Así, a partir de una publicación parcial, con sus datos, otro investigador puede “seguir” esa investigación y realizar una nueva versión y así avanzar más rápido.

Por otro lado, si se consigue financiación pública, esos resultados deberían ser públicos (datos de laboratorio, software, datos de encuestas….).

No obstante, como las convocatorias son competitivas, parece que compartir podría beneficiar a otros investigadores y perjudicar al investigador que tiene los datos y eso, está claro, crea reticencias.

Otro punto a tener en cuenta es que es confuso todavía saber cómo compartir datos: cuáles y en qué formato, y es aquí donde las bibliotecas, en general, toman un papel más relevante.

Así pues, se ve claramente que no es un tema sencillo y el investigador puede tener una serie de dudas que, antes que decir que tiene que compartir datos, es seguro que se plantea y que deberían estar muy claras:

  • ¿tengo que publicar mis datos?
  • ¿tengo permiso?
  • ¿cómo lo hago?
  • ¿cómo debo poner los datos para que se compartan correctamente?
  • ¿Tendrá algún tipo de reconocimiento o es una tarea más sin reconocer?
  • si publico algo mal, ¿seré castigado?
  • si publico los datos, ¿podrá alguien ir más rápido que yo?
  • ¿No ayudaré a otros a ganar convocatorias?
  • ¿podría otro cuestionarse rápidamente mi investigación y no permitirme avanzar?

La verdad, es que delante de estas cuestiones, a priori, puede parecer difícil que se comparta. Otro tema sería el dilema moral de: si comparto puedo hacer que la investigación en mi campo vaya mucho más rápida y entre todos obtengamos mejores resultados, pero sinceramente, para mí, esto choca frontalmente con el hecho que las convocatorias sean competitivas. A mi modo de ver, mientras lo sean, mientras unos investigadores compitan con otros para obtener financiación, va a ser muy difícil alcanzar ese nivel de transparencia que se exige sin, permítanme la expresión, nada a cambio.

 

 

Mi experiencia al respecto del #DíaMujeryCiencia #ciencia #tecnología

Posted on Actualizado enn

dia-mujer-y-ciencia-640x205-1

Ayer 11 de febrero, con el motivo de la celebración del Día internacional de la Mujer y la niña en la Ciencia, no pude evitar sentirme un poco aludida y, aunque no soy muy dada a hablar de mí misma, me apetecía compartir mi humilde punto de vista a partir de mi propia experiencia al respecto.

Soy ingeniera informática y, la verdad, es que me apasionan la tecnología y la ciencia y creo que estamos viviendo unos momentos muy interesantes y alucinantes al respecto, y… ¡lo que está por venir!. Nunca me he sentido realmente discriminada por ser mujer, aunque tengo que admitir que tampoco ha sido, ni es, un camino de rosas, sinceramente…

Lo mío con la informática fue un flechazo, un amor a primera vista que surgió poco antes de hacer mi preinscripción universitaria y la selectividad. Fue entonces cuando empecé a tener contacto con esas máquinas que eran los ordenadores y, poco a poco, mientras la mayoría de mis amigos se dedicaban a jugar a los videojuegos que iban apareciendo, yo me dedicaba a programar bucles, ciclos, cadenas infinitas, a “pintar” cosas en la pantalla y, por supuesto, el consabido “hola mundo”, en plan totalmente autodidacta, y pasarme largas horas frente al ordenador, me fascinaba que con 4 palabrejas raras, salieran esas cosas por pantalla… así pasé de estarme preparando para ser bióloga, médico o veterinaria a realizar mi preinscripción para la carrera de informática. Casi nadie entendió el cambio, y si, tuve que oír frases como: esto no es para mujeres, no podrás hacerlo, hay muchas matemáticas (?¿?), nadie te dará trabajo por ser mujer en un mundo de hombres, etc… pero lejos de amedrentarme, me reafirmó en mi objetivo.

Entré en la facultad de informática, en primera opción, y empecé a asistir a una clase de 150 personas entre las que ¡solo había DOS mujeres! mi compañera y yo. Además, yo viniendo de una escuela de solo chicas, os podéis imaginar el impacto que puede tener eso con 17 años. Ahí ya empecé a ver como irían las cosas…

Resumiendo, el segundo año de carrera ya estaba trabajando y alternando mi trabajo con los estudios, es decir, más difícil, imposible. Eso sí, siempre he trabajado de lo que me ha gustado (con ordenadores) y para mí es un placer poder dedicarme a lo que me gusta sin pensar, si estoy en un mundo de hombres o no.  A veces sí que he pensado que siendo hombre, en algunas circunstancias, lo habría tenido más fácil. Y es tristemente cierto, la gran mayoría de mis compañeros de trabajo siempre han sido hombres. ¡Hablamos de un ratio de más del 80% hombres!.

Nadie nunca me motivó, ni desde la escuela ni desde casa a hacer una carrera tecnológica o dedicarme a la ciencia, sino más bien al revés, siempre me han preguntado más cuando me casaría y tendría hijos, cosa que, por cierto, he podido alternar totalmente con mi trabajo en un mundo tecnológico, porque estoy casada y soy madre de dos niños.

Me gusta mucho el campo de la investigación y la ciencia y creo que podría haberme dedicado, pero nadie me motivó, nadie me explicó que podría serlo o ni siquiera un simple, ¡inténtalo!. Para mí el mundo de la investigación y los investigadores, era un mundo fuera de mi alcance, muy lejano y del que apenas se hablaba y, ni por un momento, se me ocurrió que podría dedicarme a ello.

Así pues, creo firmemente que las vocaciones científicas y tecnológicas deben fomentarse desde la infancia y así como puede haber cierto fomento entre los niños, como algo más natural (aunque también pienso que sigue siendo insuficiente), lamentablemente pienso que no sigue siendo así para las niñas. Aunque no nos guste y creamos que hemos cambiado mucho, creo que, realmente, y por desgracia, las cosas no han cambiado tanto como deberían, siguen existiendo demasiados estereotipos que de alguna manera, desaniman a estas niñas a seguir con la quizás sí que es su vocación.

Aún así, pienso que con iniciativas como la de ayer podemos concienciar, sobre todo a los educadores de nuestros hijos y también, claro está, a los padres, para fomentar las vocaciones científicas entre nuestros hijos. Es fácil, solo hay que ver la curiosidad natural que tienen la mayoría de los niños que considero que no se fomenta lo suficiente.

Algunos de los links de ayer que más me han gustado, que lo resumen muy bien:

http://www.agenciasinc.es/Noticias/Como-fomentar-la-presencia-femenina-en-carreras-tecnicas

http://culturacientifica.com/2017/02/11/hoy-es-el-dia-de-la-mujer-y-la-nina-en-la-ciencia-todos-lo-son/

https://twitter.com/mujerconciencia/status/830347123476594693/video/1

Donde residen los datos: Data Lake

Posted on Actualizado enn

datalake

Un nuevo concepto. La verdad es que todavía no lo había escuchado. Sí que había oído hablar de lo que significa….

Un Data lake, según José Blanco (Big data & Business Intelligence Expert) es un repositorio donde se almacenan todos los datos de la compañía, estructurados y sin estructurar, sin ningún tipo de preprocesamiento (raw data) y sin ningún tipo de esquema, para ser analizados posteriormente.

Parece ser que el término fué acuñado por James Dixon, CTO de Pentaho, en contraposición al concepto de Data Mart que es un repositorio menor de atributos relevantes extraídos y analizados desde los datos en bruto (raw data).

Argumentó que los DM tienen algunos problemas inherentes para los que los Data Lakes son la solución óptima. Suelen ser problemas relativos a los silos de información, es decir, que realmente, los data marts dan una visión sesgada y parcial de la información porque debe contener información estructurada y homogénea. Así, la mejor solución es tener toda la información, sea del tipo que sea, en bruto, para su análisis en un repositorio basado en Hadoop.

Así, la idea de un Data Lake, es tener en un solo repositorio TODA la información de la institución, que va desde los datos en bruto  (que implica copia exacta de los datos del sistema fuente), a los datos transformados, que se utilizan para diversas tareas, incluyendo informes, visualización, análisis y machine learning.

Un data lake incluye datos estructurados de bases de datos relacionales (filas y columnas), semi-estructurados (CSV, logs, XML, JSON), datos no estructurados (emails, documentos, PDFs) e incluso datos binarios (imágenes, audio, vídeo), creando así un repositorio centralizado de datos que contiene cualquier tipo de dato.

He leído una comparativa respecto a los DWH que me ha gustado:

“If you think of a datamart as a store of bottled water – cleansed and packaged and structured for easy consumption – the data lake is a large body of water in a more natural state. The contents of the data lake stream in from a source to fill the lake, and various users of the lake can come to examine, dive in, or take samples.”

Así pues, el datamart tiene formato, hemos trabajado (cocinado) los datos y da unos resultados que queremos obtener, así como una visión parcial o más bien temática sobre el ámbito que queremos analizar. El data lake no, en el data lake está todo, y podemos usar y crear las relaciones necesarias según nuestras necesidades. Yo veo el Data Lake como un repositorio más orientado a las máquinas, es decir, contienen la información necesaria para que un máquina pueda procesar la información, sobre todo orientado a técnicas de machine learning, deep learning, IA, etc… Pero obviamente, los resultados que se pueden obtener son claramente más potentes.

¿Podemos decir que se dejarán de usar los DWH? Yo personalmente creo que el concepto de DWH y un Data Lake no son lo mismo y que han sido ideados para diferentes propósitos, aunque es inevitable compararlos, de hecho, creo que podría decirse que los Data Marts podrían estar incluidos o ser una parte del Data Lake, ¿no?. Sí que diré que, por mi experiencia con las Universidades, los DWH no han tenido el resultado esperado. Hace unos años, se realizaron grandes inversiones para el desarrollo de grandes DWH corporativos, pero el resultado es que son sistemas muy grandes, difíciles de mantener y no son ágiles de usar y no se ha generalizado su uso, en general, dentro de la institución (esos son los comentarios que he oído a sus usuarios o usuarios potenciales de las universidades). Así que creo que un Data Lake, en un periodo no muy largo de tiempo, podría llegar a sustituir el uso del DWH como lo conocemos ahora, o bien, podría consolidarse como una herramienta con muchos más resultados de los que han podido ofrecer los grandes DWH corporativos.

Me ha gustado esta comparativa entre un DWH y un Data Lake:

La conclusión es clara, ¿no?.

 

Ver artículo completo de José Blanco, sobre Data Lake:

https://www.linkedin.com/pulse/que-es-un-data-lake-big-y-bi-jose-blanco

Otras referencias usadas:

http://www.kdnuggets.com/2015/09/data-lake-vs-data-warehouse-key-differences.html

https://en.wikipedia.org/wiki/Data_lake