ARTDEPARTMENT

Solicitar una consulta

un hombre monta su propio motor de búsqueda con partes de un viejo servidor y (mucha ) ayuda de la IA

Publicado el 
septiembre 17, 2025

Hace casi treinta abriles, cuando Google nació como un tesina de investigación en la Universidad de Standford llamado 'Backrub', sus fundadores lo pusieron en marcha con un hardware modesto para la época: un servidor positivo con 40 gigabytes de almacenamiento alojado en una carcasa hecha con bloques de Secular. Hoy, cierto ha querido imitar estos mismos orígenes en su propia casa. 

Repitiendo. Ahora esta historia parece repetirse de una forma en realidad interesante. Con ingenio y aprovechando el hardware que las grandes empresas desechan, un desarrollador llamado Ryan Pearce ha creado un motor de búsqueda sencillo y sorprendentemente robusto. Lo mejor de todo es que el centro de datos que hay detrás es un rincón de su cuarto de lavadora, concretamente acordado al costado de la secadora. 

Desde este humilde oficio, Pearce opera Searcha Page y su variable centrada en la privacidad, Seek Ninja. De esta guisa, cuando se realiza una búsqueda en estas páginas, la consulta viaja directamente a un servidor que funciona entre ciclos de lavado. Y lo más increíble es que, a excepción de por una ligera latencia que Pearce ha ido mejorando, los resultados son de una calidad asombrosa. 

"Ahora mismo, en el cuarto de la colada, tengo más capacidad de almacenamiento que la que tenía Google en el año 2000", afirma Pearce. Y esa es la secreto de todo: la democratización de una tecnología que parecía inalcanzable.

Un programador quiso alojar una página web entera en un vapeador. Y ha contado cómo lo consiguió

El contexto. Crear una pulvínulo de datos para dar vida a un motor de búsqueda no es poco sencillo. En este caso, Pearce ha construido la pulvínulo con 2.000 millones de entradas y aplazamiento duplicarla en menos de seis meses. Para contextualizar, el Google de 1998 tenía 24 millones de páginas indexadas. Y aunque las cifras de Pearce son una migaja en el océano comparada con los 400.000 millones  de entradas que Google manejaba en 2020, es un gran logro para un tesina individual. 

El hardware. Pearce ha aplicado un engendro que podríamos tildar "arbitraje de actualizaciones". Las grandes empresas renuevan sus servidores cada tres o cuatro abriles, desechando equipos increíblemente potentes que acaban en el mercado de segunda mano a precios de risa. Y ahí es donde Pearce trató de usar al mayor. 

El cerebro de su sistema es una CPU AMD EPYC 7532 de 32 núcleos. En su emanación en 2020, este procesador costaba más de 3.000 dólares. Pearce lo consiguió en eBay por menos de 200 dólares. El sistema completo, que incluye medio terabyte de memoria RAM, le costó unos 5.000 dólares, una fracción mínima de su valía diferente. Es un ejemplo valentísimo de auto-alojamiento (self-hosting) llevado al extremo.

Mucha ayuda de la IA. Pero el efectivo cambio de ideal no está en el hardware, sino en el software. Lo que permite a Pearce competir, al menos conceptualmente, es la propia inteligencia químico, que ahora mismo genera controversia internamente de los navegadores. 

Es por ello que mientras muchos usuarios critican los resúmenes generados por IA de Google o el chatbot de Bing, Pearce utiliza los modelos de jerga grandes (LLM) de una guisa diferente. No los usa para darte una respuesta directa, sino como una útil de explicación para acelerar la creación del motor de búsqueda.

"Lo que estoy haciendo es en sinceridad una búsqueda muy tradicional, lo que Google hacía hace 20 abriles", explica Pearce. "La única diferencia es que uso la IA para la expansión de palabras secreto y para ayudar con la comprensión del contexto, que es la parte difícil".

Política de explotación. De esta guisa, en oficio de construir desde cero complejos algoritmos de procesamiento de jerga natural, Pearce aprovecha modelos como Vehemencia 3 (a través del servicio de bajo coste SambaNova) para refinar las búsquedas. Esto le permite construir un sistema engorroso de forma interactiva, escribiendo código tradicional para reemplazar gradualmente las funciones que inicialmente delega en la IA. Su código pulvínulo ya tiene unas 150.000 líneas, pero ya apunta apunta a muchas más. 

No está solo. El caso de Pearce no es eventual. Es la punta de alabarda de una nueva tendencia de desarrolladores independientes que se atreven a reinventar la búsqueda. Otro ejemplo es Wilson Lin, quien, a diferencia de Pearce, optó por un enfoque basado en la aglomeración. Lin ha creado su propio motor de búsqueda utilizando bases de datos vectoriales, donde los resultados se agrupan por similitud semántica en oficio de por coincidencia de palabras secreto que es a lo que estamos acostumbrados. 

Uno y otro proyectos, aunque con filosofías distintas (uno auto-alojado y tradicional, el otro en la aglomeración y vectorial), dependen de dos pilares fundamentales:

  1. Modelos de IA accesibles: Los LLMs han limitado drásticamente la barrera de entrada para el explicación de sistemas complejos de comprensión del jerga.
  2. Datos abiertos: Uno y otro se apoyan en Common Crawl, un repositorio notorio y masivo de datos web que sirve como pulvínulo para entrenar IAs y construir índices de búsqueda sin tener que rastrear toda la web desde cero.

Hice una reserva en Booking a un precio anormalmente bajo y me la cancelaron. La OCU demostró lo desprotegida que estoy

Buscadores alternativos. Estos proyectos se unen a una creciente comunidad de buscadores alternativos como DuckDuckGo, Brave Search o el más hornacina Marginalia, que se centra en descubrir sitios web pequeños y no comerciales. Lo que demuestran Pearce y Lin es que la tecnología para construir un buscador ya no es el principal obstáculo. "La única barrera para competir en realidad con Google", afirma Lin, "no es tanto la tecnología, sino principalmente las fuerzas del mercado".

El futuro. Ryan Pearce es consciente de las limitaciones de su tesina. Su servidor genera tanto calor que tuvo que mudarlo de su dormitorio al tina. Por ahora, solo opera en inglés y ha empezado a cotejar con anuncios de afiliados para financiar su crecimiento.

Su plan es, si el tráfico sigue aumentando, mover el servidor a un centro de colocación de datos. El "Google del tina" no vivirá allí para siempre.

Imágenes | Christin Hume 

En Genbeta | Los monopolios como Google o Meta crecen en cada revolución y es por una osadía de 1995 para la seguridad de un navegador añejo

Source link

Compartir este artículo

[social_warfare]

Consultoria Personalizada

¡Si aun no tienes presencia en internet o 
necesitas ayuda con tus proyectos, por favor, escribenos!

Enviar Consulta Gratis

Más para leer

En ARTDEPARTMENT nos especializamos en brindar soluciones para que tu negocio, empresa o proyecto sea visible en internet.

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

cloud-syncearthbullhorn linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram