De los físicos a la ciencia de datos (de los motores de la ciencia al plancton de oficina). la tercera parte

De los físicos a la ciencia de datos (de los motores de la ciencia al plancton de oficina). la tercera parte

Esta imagen es de Arthur Kuzin (n01z3), resume con bastante precisión el contenido de la publicación del blog. Como resultado, la siguiente narrativa debería percibirse más como una historia de viernes que como algo extremadamente útil y técnico. Además, cabe señalar que el texto es rico en palabras en inglés. No sé cómo traducir algunos de ellos correctamente y simplemente no quiero traducir algunos de ellos.

La primera parte
La segunda parte.

En los dos primeros episodios se revela cómo se produjo la transición de un entorno académico a un entorno industrial. En este, la conversación será sobre lo que pasó después.

Era enero de 2017. En ese momento tenía poco más de un año de experiencia laboral y trabajaba en San Francisco en la empresa Verdadero acuerdo como el Sr. Científico de datos.

TrueAccord es una startup de cobro de deudas. En términos simples: una agencia de cobranza. Los coleccionistas suelen llamar mucho. Enviamos muchos correos electrónicos, pero hicimos pocas llamadas. Cada correo electrónico conducía al sitio web de la empresa, donde se ofrecía al deudor un descuento en la deuda e incluso se le permitía pagar a plazos. Este enfoque condujo a una mejor recaudación, permitió escalar y menos exposición a demandas.

La empresa era normal. El producto es claro. La gestión es sensata. La ubicación es buena.

En promedio, la gente del valle trabaja en un mismo lugar durante aproximadamente un año y medio. Es decir, cualquier empresa para la que trabajes es sólo un pequeño paso. En este paso recaudarás algo de dinero, adquirirás nuevos conocimientos, habilidades, conexiones y líneas en tu currículum. Después de esto hay una transición a la siguiente etapa.

En TrueAccord, participé en adjuntar sistemas de recomendación a boletines informativos por correo electrónico, así como en priorizar las llamadas telefónicas. El impacto es comprensible y se midió bastante bien en dólares mediante pruebas A/B. Como no existía el aprendizaje automático antes de mi llegada, el impacto de mi trabajo no fue malo. Nuevamente, es mucho más fácil mejorar algo que algo que ya está muy optimizado.

Después de seis meses de trabajar en estos sistemas, incluso aumentaron mi salario base de $150 mil a $163 mil. En la comunidad Ciencia de datos abiertos (ODS) Hay un meme sobre 163 dólares. Desde aquí crece con sus patas.

Todo esto fue maravilloso, pero no llevó a ninguna parte, o llevó, pero no allí.

Tengo un gran respeto por TrueAccord, tanto por la empresa como por las personas con las que trabajé allí. Aprendí mucho de ellos, pero no quería trabajar durante mucho tiempo en sistemas de recomendación en una agencia de cobros. A partir de este paso había que avanzar en alguna dirección. Si no hacia adelante y hacia arriba, al menos hacia los lados.

¿Qué no me gustó?

  1. Desde la perspectiva del aprendizaje automático, los problemas no me entusiasmaron. Quería algo moderno, juvenil, es decir, aprendizaje profundo, visión por computadora, algo bastante cercano a la ciencia o al menos a la alquimia.
  2. Una startup, e incluso una agencia de cobros, tiene problemas para contratar personal altamente cualificado. Como startup, no puede pagar mucho. Pero como agencia de cobranza, pierde estatus. En términos generales, ¿si una chica en una cita te pregunta dónde trabajas? Su respuesta: "En Google" suena mucho mejor que "agencia de cobranza". Me molestó un poco el hecho de que a mis amigos que trabajan en Google y Facebook, a diferencia de mí, el nombre de su empresa les abrió puertas como: te pueden invitar a una conferencia o reunión como orador, o personas más interesantes pueden escribir en LinkedIn. con una oferta para reunirse y charlar con un vaso de té. Realmente me encanta comunicarme con personas que no conozco en persona. Así que si vives en San Francisco, no dudes en escribirnos: vamos a tomar un café y hablar.
  3. Además de mí, en la empresa trabajaban tres científicos de datos. Yo estaba trabajando en aprendizaje automático y ellos estaban trabajando en otras tareas de ciencia de datos, que son comunes en cualquier startup de aquí a mañana. Como resultado, no entendían realmente el aprendizaje automático. Pero para crecer, necesito comunicarme con alguien, discutir artículos y los últimos desarrollos y, al final, pedir consejo.

¿Qué había disponible?

  1. Educación: física, no informática.
  2. El único lenguaje de programación que conocía era Python. Tenía la sensación de que necesitaba cambiar a C++, pero todavía no podía hacerlo.
  3. Un año y medio de trabajo en la industria. Además, en el trabajo no estudié ni Deep Learning ni Computer Vision.
  4. Ni un solo artículo sobre aprendizaje profundo / visión por computadora en el currículum.
  5. Hubo un logro de Kaggle Master.

¿Qué querías?

  1. Un puesto en el que será necesario formar muchas redes, y más cerca de la visión por ordenador.
  2. Es mejor si es una gran empresa como Google, Tesla, Facebook, Uber, LinkedIn, etc. Aunque en caso de apuro, una startup sería suficiente.
  3. No necesito ser el mayor experto en aprendizaje automático del equipo. Había una gran necesidad de camaradas mayores, mentores y todo tipo de comunicación, que se suponía aceleraría el proceso de aprendizaje.
  4. Después de leer publicaciones de blogs sobre cómo los graduados sin experiencia industrial tienen una compensación total de entre 300 y 500 dólares al año, quería entrar en el mismo rango. No es que esto me moleste mucho, pero como dicen que es un fenómeno común, pero tengo menos, entonces esto es una señal.

La tarea parecía completamente solucionable, aunque no en el sentido de que puedas saltar a cualquier empresa, sino de que si te mueres de hambre, todo saldrá bien. Es decir, decenas o cientos de intentos, y el dolor de cada fracaso y cada rechazo, deben utilizarse para agudizar la concentración, mejorar la memoria y alargar el día a 36 horas.

Modifiqué mi currículum, comencé a enviarlo y a ir a entrevistas. Pasé por alto a la mayoría de ellos en la etapa de comunicación con RR.HH. Mucha gente necesitaba C++, pero yo no lo sabía y tenía el fuerte presentimiento de que no estaría muy interesado en puestos que requirieran C++.

Vale la pena señalar que casi al mismo tiempo hubo una transición de fase en el tipo de competiciones en Kaggle. Antes de 2017 había muchos datos tabulares y muy raramente datos de imágenes, pero a partir de 2017 hubo muchas tareas de visión por computadora.

La vida fluyó de la siguiente manera:

  1. Trabajar durante el día.
  2. Cuando la pantalla técnica/en el sitio te tomas un tiempo libre.
  3. Tardes y fines de semana Kaggle + artículos / libros / publicaciones de blog

El final del 2016 estuvo marcado por el hecho de que me uní a la comunidad. Ciencia de datos abiertos (ODS), lo que simplificó muchas cosas. Hay muchas personas en la comunidad con una rica experiencia industrial, lo que nos permitió hacer muchas preguntas estúpidas y obtener muchas respuestas inteligentes. También hay muchos especialistas muy sólidos en aprendizaje automático de todo tipo, lo que, inesperadamente, me permitió, a través de ODS, cerrar el problema con una comunicación regular y profunda sobre ciencia de datos. Hasta ahora, en términos de ML, ODS me da muchas veces más de lo que obtengo en el trabajo.

Bueno, como siempre, ODS tiene suficientes especialistas en competiciones en Kaggle y otros sitios. Resolver problemas en equipo es más divertido y productivo, así que con chistes, malas palabras, memes y otros entretenimientos nerds, comenzamos a resolver los problemas uno por uno.

En marzo de 2017, en equipo con Serega Mushinsky, tercer lugar para Detección de funciones de imágenes satelitales Dstl. Medalla de oro en Kaggle + $20k para dos. En esta tarea se mejoró el trabajo con imágenes satelitales + segmentación binaria vía UNet. Publicación de blog sobre Habré sobre este tema.

Ese mismo marzo fui a una entrevista en NVidia con el equipo de Self Driving. Realmente tuve problemas con las preguntas sobre la detección de objetos. No había suficiente conocimiento.

Por suerte, al mismo tiempo comenzó el concurso de Detección de Objetos en imágenes aéreas del mismo DSTL. Dios mismo ordenó solucionar el problema y modernizarlo. Un mes de tardes y fines de semana. Adquirí el conocimiento y terminé segundo. Este concurso tenía un matiz interesante en las reglas, lo que me llevó a aparecer en Rusia en canales federales y no tan federales. me subí Inicio Lenta.ruy en varias publicaciones impresas y en línea. Mail Ru Group recibió algunas relaciones públicas positivas a mi costa y con su propio dinero, y la ciencia fundamental en Rusia se enriqueció con 12000 libras. Como siempre, se escribió sobre este tema. publicación de blog en hubr. Vaya allí para obtener más detalles.

Al mismo tiempo, un reclutador de Tesla se puso en contacto conmigo y se ofreció a hablar sobre el puesto de Visión por Computadora. Estuve de acuerdo. Revisé rápidamente el material para llevar a casa, dos pantallas tecnológicas, una entrevista in situ y tuve una conversación muy agradable con Andrei Karpathy, que acababa de ser contratado en Tesla como director de IA. La siguiente etapa es la verificación de antecedentes. Después de eso, Elon Musk tuvo que aprobar personalmente mi solicitud. Tesla tiene un estricto acuerdo de confidencialidad (NDA).
No pasé la verificación de antecedentes. El reclutador dijo que chateo mucho en línea, violando el acuerdo de confidencialidad. El único lugar donde dije algo sobre una entrevista en Tesla fue ODS, por lo que la hipótesis actual es que alguien tomó una captura de pantalla y escribió a Recursos Humanos en Tesla, y fui retirado de la carrera fuera de peligro. Fue una pena entonces. Ahora me alegro de que no haya funcionado. Mi puesto actual es mucho mejor, aunque sería muy interesante trabajar con Andrey.

Inmediatamente después de eso, me lancé al concurso de imágenes satelitales en Kaggle de Planet Labs - Entendiendo el Amazonas desde el espacio. El problema era simple y extremadamente aburrido; nadie quería resolverlo, pero todos querían una medalla de oro gratis o un premio en metálico. Por eso, con un equipo de Kaggle Masters de 7 personas, acordamos que lanzaríamos hierro. Entrenamos 480 redes en el modo 'fit_predict' y con ellas creamos un conjunto de tres pisos. Terminamos séptimos. Publicación de blog que describe la solución de Arthur Kuzin. Por cierto, Jeremy Howard, ampliamente conocido como el creador IA rápida terminó 23.

Una vez finalizado el concurso, a través de un amigo que trabajaba en AdRoll, organicé un Meetup en sus instalaciones. Los representantes de Planet Labs hablaron allí sobre cómo fue la organización del concurso y el marcado de datos. Wendy Kwan, que trabaja en Kaggle y supervisó la competencia, habló sobre cómo la vio. Describí nuestra solución, trucos, técnicas y detalles técnicos. Dos tercios de la audiencia resolvieron este problema, por lo que las preguntas fueron al grano y, en general, todo estuvo bien. Jeremy Howard también estaba allí. Resultó que terminó en el puesto 23 porque no sabía cómo apilar el modelo y no conocía en absoluto este método de construcción de conjuntos.

Las reuniones en el valle sobre aprendizaje automático son muy diferentes a las reuniones en Moscú. Por regla general, las reuniones en el valle son al final. Pero el nuestro salió bien. Desafortunadamente, el camarada que debía presionar el botón y registrar todo no presionó el botón :)

Después de eso, me invitaron a hablar para el puesto de Ingeniero de Aprendizaje Profundo en este mismo Planet Labs, e inmediatamente en el sitio. No lo pasé. La redacción de la negativa es que no hay suficiente conocimiento en Deep Learning.

Diseñé cada concurso como un proyecto en Etiqueta LinkedIn. Para el problema DSTL escribimos preimpresión y lo publiqué en arxiv. No es un artículo, pero sigue siendo pan. También recomiendo a todos los demás que inflen su perfil de LinkedIn a través de concursos, artículos, habilidades, etc. Existe una correlación positiva entre la cantidad de palabras clave que tienes en tu perfil de LinkedIn y la frecuencia con la que la gente te envía mensajes.

Si en invierno y primavera era muy técnico, en agosto ya tenía conocimientos y confianza en mí mismo.

A finales de julio, un chico que trabajaba como gerente de ciencia de datos en Lyft me contactó en LinkedIn y me invitó a tomar un café y charlar sobre la vida, sobre Lyft, sobre TrueAccord. Hablamos. Se ofreció a entrevistarse con su equipo para el puesto de científico de datos. Dije que la opción funciona, siempre que sea Visión por Computadora / Aprendizaje Profundo desde la mañana hasta la noche. Aseguró que no hubo objeciones de su parte.

Envié mi currículum y lo subió al portal interno de Lyft. Después de eso, el reclutador me llamó para abrir mi currículum y saber más sobre mí. Desde las primeras palabras, quedó claro que para él esto era una formalidad, ya que en su currículum le resultaba obvio que "no soy material para Lyft". Supongo que después de eso mi currículum fue a la basura.

Todo este tiempo, mientras me entrevistaban, hablé de mis fracasos y caídas en ODS y los chicos me dieron su opinión y me ayudaron en todo lo posible con consejos, aunque, como de costumbre, también hubo mucho trolling amistoso allí.

Uno de los miembros de ODS se ofreció a conectarme con su amigo, que es el Director de Ingeniería de Lyft. Dicho y hecho. Vengo a Lyft a almorzar y, además de este amigo, también hay un jefe de ciencia de datos y un gerente de producto que es un gran admirador del aprendizaje profundo. Durante el almuerzo charlamos por DL. Y como llevo medio año entrenando redes 24 horas al día, 7 días a la semana, leyendo metros cúbicos de literatura y ejecutando tareas en Kaggle con resultados más o menos claros, podría hablar de Deep Learning durante horas, tanto en términos de nuevos artículos como de técnicas prácticas.

Después del almuerzo me miraron y me dijeron: se ve inmediatamente que eres guapo, ¿quieres hablar con nosotros? Además, agregaron que para mí está claro que se puede omitir la pantalla de inicio + tecnología. Y que seré invitado inmediatamente al lugar. Estuve de acuerdo.

Después de eso, ese reclutador me llamó para programar una entrevista in situ y no quedó satisfecho. Murmuró algo sobre no saltar sobre tu cabeza.

Vino. Entrevista en sitio. Cinco horas de comunicación con diferentes personas. No hubo ni una sola pregunta sobre el Deep Learning, ni sobre el aprendizaje automático en principio. Como no existe el aprendizaje profundo/visión por computadora, entonces no me interesa. Por tanto, los resultados de la entrevista fueron ortogonales.

Este reclutador llama y dice: felicidades, has pasado a la segunda entrevista in situ. Todo esto es sorprendente. ¿Cuál es el segundo en el sitio? Nunca he oído hablar de tal cosa. Fui. Hay un par de horas allí, esta vez todo sobre el aprendizaje automático tradicional. Eso es mejor. Pero todavía no es interesante.

El reclutador llama para felicitarme por haber pasado la tercera entrevista in situ y promete que será la última. Fui a verlo y había tanto una licencia de manejar como un CV.

Tuve un prior durante muchos meses que me dijo que no habría oferta. No entrenaré en habilidades técnicas, sino en habilidades blandas. No por el lado blando, sino por el hecho de que el puesto se cerrará o que la empresa aún no está contratando, sino que simplemente está probando el mercado y el nivel de los candidatos.

Mediados de agosto. Bebí cerveza bien. Pensamientos oscuros. Han pasado 8 meses y aún no hay oferta. Es bueno ser creativo bajo la cerveza, especialmente si la creatividad es extraña. Se me ocurre una idea. Lo comparto con Alexey Shvets, quien en ese momento era postdoctorado en el MIT.

¿Qué pasa si asistes a la conferencia DL/CV más cercana, miras las competiciones que se celebran como parte de ella, te capacitas en algo y te presentas? Dado que todos los expertos que hay allí construyen sus carreras sobre esta base y lo han estado haciendo durante muchos meses o incluso años, no tenemos ninguna posibilidad. Pero no da miedo. Hacemos una presentación significativa, volamos al último lugar y luego escribimos una preimpresión o un artículo sobre cómo no somos como los demás y hablamos sobre nuestra decisión. Y el artículo ya está en LinkedIn y en tu currículum.

Es decir, parece relevante y hay más palabras clave correctas en el currículum, lo que debería aumentar ligeramente las posibilidades de llegar a la pantalla técnica. Código y envíos míos, mensajes de texto de Alexey. Juego, por supuesto, pero ¿por qué no?

Dicho y hecho. La conferencia más cercana que buscamos en Google fue MICCAI y de hecho había competencias allí. Llegamos al primero. Fue ANÁLISIS DE IMÁGENES gastrointestinales (GIANA). La tarea tiene 3 subtareas. Faltaban 8 días para la fecha límite. Me recuperé por la mañana, pero no abandoné la idea. Tomé mis tuberías de Kaggle y las cambié de datos satelitales a datos médicos. 'fit_predict'. Alexey preparó una descripción de dos páginas de las soluciones para cada problema y la enviamos. Listo. En teoría, puedes exhalar. Pero resultó que había otra tarea para el mismo taller (Segmentación de instrumentos robóticos) con tres subtareas y que su fecha límite se adelantó 4 días, es decir, podemos hacer 'fit_predict' allí y enviarlo. Eso es lo que hicimos.

A diferencia de Kaggle, estas competiciones tenían sus propias características académicas:

  1. Sin tabla de clasificación. Los envíos se envían por correo electrónico.
  2. Serás eliminado si un representante del equipo no viene a presentar la solución en la conferencia del Taller.
  3. Su lugar en la clasificación se conocerá sólo durante la conferencia. Una especie de drama académico.

La conferencia MICCAI 2017 se celebró en la ciudad de Quebec. Para ser honesto, en septiembre estaba empezando a agotamiento, por lo que la idea de tomarme una semana libre del trabajo y dirigirme a Canadá parecía interesante.

Vino a la conferencia. Vine a este Taller, no conozco a nadie, estoy sentado en un rincón. Todos se conocen, se comunican, dicen ingeniosas palabras médicas. Reseña de la primera competición. Los participantes hablan y hablan de sus decisiones. Está fresco allí, con un brillo. Mi turno. Y de alguna manera incluso me avergüenzo. Resolvieron el problema, trabajaron en él, hicieron avanzar la ciencia y nosotros estamos puramente "fit_predict" a partir de desarrollos pasados, no para la ciencia, sino para mejorar nuestro currículum.

Salió y dijo que yo tampoco soy un experto en medicina, se disculpó por hacerles perder el tiempo y me mostró una diapositiva con la solución. Bajé al pasillo.

Anuncian la primera subtarea: somos primeros y por un margen.
Se anuncian el segundo y el tercero.
Anuncian el tercero, otra vez primero y otra vez con ventaja.
El general es el primero.

De los físicos a la ciencia de datos (de los motores de la ciencia al plancton de oficina). la tercera parte

Comunicado de prensa oficial.

Algunos en el público sonríen y me miran con respeto. Otros, aquellos que aparentemente eran considerados expertos en la materia, habían ganado una subvención para esta tarea y llevaban muchos años haciéndolo, tenían una expresión ligeramente distorsionada en sus rostros.

La siguiente es la segunda tarea, la que tiene tres subtareas y que se ha adelantado cuatro días.

Aquí también me disculpé y volví a mostrar nuestra única diapositiva.
La misma historia. Dos primeros, un segundo, primero común.

Creo que esta es probablemente la primera vez en la historia que una agencia de cobranza gana un concurso de imágenes médicas.

Y ahora estoy en el escenario, me entregan una especie de diploma y me bombardean. ¿Cómo carajo puede ser eso? Estos académicos gastan el dinero de los contribuyentes, trabajan para simplificar y mejorar la calidad del trabajo de los médicos, es decir, en teoría, mi esperanza de vida, y alguien destrozó a todo este personal académico en la bandera británica en unas pocas noches.

Una ventaja de esto es que en otros equipos, los estudiantes de posgrado que han estado trabajando en estas tareas durante muchos meses tendrán un currículum atractivo para RR.HH., es decir, accederán fácilmente a la pantalla técnica. Y ante mis ojos hay un correo electrónico recién recibido:

A Googler recently referred you for the Research Scientist, Google Brain (United States) role. We carefully reviewed your background and experience and decided not to proceed with your application at this time.

En general, desde el escenario pregunto al público: “¿Alguien sabe dónde trabajo?” Uno de los organizadores del concurso lo sabía: buscó en Google qué era TrueAccord. El resto no lo es. Continúo: “Trabajo para una agencia de cobros y en el trabajo no hago ni Visión por Computadora ni Aprendizaje Profundo. Y en muchos sentidos, esto sucede porque los departamentos de recursos humanos de Google Brain y Deepmind filtran mi currículum y no me dan la oportunidad de mostrar formación técnica. "

Entregaron el certificado, un descanso. Un grupo de académicos me llama a un lado. Resultó que este es un grupo de Salud con Deepmind. Quedaron tan impresionados que inmediatamente quisieron hablar conmigo sobre la vacante de ingeniero de investigación en su equipo. (Hablamos. Esta conversación duró 6 meses, pasé el examen para llevar a casa, pero se interrumpió en la pantalla técnica. 6 meses desde el inicio de la comunicación con la pantalla técnica es mucho tiempo. La larga espera da una idea de inutilidad. Ingeniero de investigación en Deepmind en Londres, en el contexto de TrueAccord hubo un fuerte paso adelante, pero en el contexto de mi posición actual es un paso hacia abajo. Desde una distancia de dos años que han pasado desde entonces, es bueno que no fue así.)

Conclusión

Casi al mismo tiempo, recibí una oferta de Lyft, que acepté.
Con base en los resultados de estos dos concursos con MICCAI, se publicó lo siguiente:

  1. Segmentación automática de instrumentos en cirugía asistida por robot mediante aprendizaje profundo
  2. Detección y localización de angiodisplasia mediante redes neuronales convolucionales profundas.
  3. Desafío de segmentación de instrumentos robóticos 2017

Es decir, a pesar de lo descabellada de la idea, agregar artículos incrementales y preimpresiones a través de concursos funciona bien. Y en los años siguientes lo empeoramos aún más.

De los físicos a la ciencia de datos (de los motores de la ciencia al plancton de oficina). la tercera parte

He estado trabajando en Lyft durante los últimos años haciendo visión por computadora/aprendizaje profundo para automóviles autónomos. Es decir, obtuve lo que quería. Y tareas, una empresa de alto estatus, colegas fuertes y todas las demás ventajas.

A lo largo de estos meses tuve comunicación tanto con grandes empresas Google, Facebook, Uber, LinkedIn, como con un mar de startups de diversos tamaños.

Me dolió todos estos meses. El universo te dice cada día algo no muy agradable. El rechazo regular, la comisión de errores con regularidad y todo esto está aderezado con un sentimiento persistente de desesperanza. No hay garantías de que tendrá éxito, pero existe la sensación de que es un tonto. Me recuerda mucho a cómo intenté encontrar trabajo justo después de la universidad.

Creo que muchos buscaban trabajo en el valle y todo fue mucho más fácil para ellos. El truco, en mi opinión, es este. Si buscas trabajo en un campo en el que entiendes, tienes mucha experiencia y tu currículum dice lo mismo, no hay problemas. Lo tomé y lo encontré. Hay muchas vacantes.

Pero si está buscando trabajo en un campo que es nuevo para usted, es decir, cuando no hay conocimientos, no hay conexiones y su currículum dice algo mal, en este momento todo se vuelve extremadamente interesante.

En este momento, los reclutadores me escriben regularmente y me ofrecen hacer lo mismo que estoy haciendo ahora, pero en una empresa diferente. Realmente es hora de cambiar de trabajo. Pero no tiene sentido hacer algo en lo que ya soy bueno. ¿Para qué?

Pero para lo que quiero, nuevamente no tengo ni los conocimientos ni las líneas en mi currículum. A ver cómo acaba todo esto. Si todo va bien, escribiré la siguiente parte. 🙂

Fuente: habr.com

Añadir un comentario